AI BENCHY तुलना

Owl Alpha vs Laguna M.1

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-30

मेट्रिक	Owl Alpha Owl Alpha none रिलीज़: 2026-04-30	Laguna M.1 Laguna M.1 medium रिलीज़: 2026-04-28 निःशुल्क उपलब्ध

मेट्रिक	Owl Alpha Owl Alpha none रिलीज़: 2026-04-30	Laguna M.1 Laguna M.1 medium रिलीज़: 2026-04-28 निःशुल्क उपलब्ध
स्कोर	6.0	6.3
रैंक	#87	#75
विश्वसनीयता	10.0	10.0
संगति	9.1	8.6
सही परीक्षण
प्रति प्रयास पास दर	46.3%	53.7%
अस्थिर टेस्ट	2	3
कुल रन	54	54
प्रति परिणाम लागत	0.000	0.000
कुल लागत	$0.000	$0.000
???? ???	$0.000 / 1M	$0.000 / 1M
????? ???	$0.000 / 1M	$0.000 / 1M
आउटपुट टोकन	1,671	63,822
रीजनिंग टोकन	0	0
प्रतिक्रिया समय (औसत)	7.07s	13.90s
प्रतिक्रिया समय (अधिकतम)	32.27s	53.14s
प्रतिक्रिया समय (कुल)	127.23s	250.28s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Owl Alpha	3.4	7.9	16.7%	1		2.78s	57	0
Laguna M.1	6.6	10.0	50.0%	0		9.15s	7,839	0

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Owl Alpha	10.0	10.0	100.0%	0		32.27s	450	0
Laguna M.1	4.3	1.1	66.7%	1		35.61s	14,327	0

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Owl Alpha	3.0	10.0	0.0%	0		21.74s	315	0
Laguna M.1	3.0	10.0	0.0%	0		53.14s	12,272	0

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Owl Alpha	10.0	10.0	100.0%	0		3.60s	246	0
Laguna M.1	10.0	10.0	100.0%	0		4.93s	2,296	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Owl Alpha	5.3	10.0	33.3%	0		3.00s	27	0
Laguna M.1	5.3	7.2	44.4%	1		24.14s	19,020	0

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Owl Alpha	4.3	10.0	0.0%	0		4.61s	80	0
Laguna M.1	4.1	10.0	0.0%	0		6.86s	1,294	0

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Owl Alpha	6.4	10.0	50.0%	0		2.63s	63	0
Laguna M.1	10.0	10.0	100.0%	0		4.30s	1,626	0

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Owl Alpha	5.9	7.2	55.6%	1		4.43s	202	0
Laguna M.1	3.6	7.2	22.2%	1		6.97s	3,978	0

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Owl Alpha	10.0	10.0	100.0%	0		22.78s	231	0
Laguna M.1	10.0	10.0	100.0%	0		6.31s	1,170	0

त्वरित तुलना

तुलना जोड़ी बदलें

Gemini 2.5 FlashnonevsLaguna M.1mediumनिःशुल्क उपलब्ध Gemma 4 26B A4Bnoneनिःशुल्क उपलब्धvsLaguna M.1mediumनिःशुल्क उपलब्ध Laguna M.1mediumनिःशुल्क उपलब्धvsMiMo-V2-Omninone Laguna M.1mediumनिःशुल्क उपलब्धvsGLM 5V Turbonone Laguna M.1mediumनिःशुल्क उपलब्धvsQwen3.5-Flashnone gpt-oss-120bmediumनिःशुल्क उपलब्धvsOwl Alphanone Owl AlphanonevsLaguna Xs.2mediumनिःशुल्क उपलब्ध Seed-2.0-LitenonevsLaguna M.1mediumनिःशुल्क उपलब्ध Laguna M.1mediumनिःशुल्क उपलब्धvsQwen3.5-35B-A3Bnone DeepSeek V4 PrononevsLaguna M.1mediumनिःशुल्क उपलब्ध Laguna M.1mediumनिःशुल्क उपलब्धvsQwen3.6 27Bnone Laguna M.1mediumनिःशुल्क उपलब्धvsGLM 5none