AI BENCHY तुलना

Laguna M.1 vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-29

मेट्रिक	Laguna M.1 Laguna M.1 none रिलीज़: 2026-04-28 निःशुल्क उपलब्ध	Grok 4.20 Grok 4.20 none रिलीज़: 2026-03-31

मेट्रिक	Laguna M.1 Laguna M.1 none रिलीज़: 2026-04-28 निःशुल्क उपलब्ध	Grok 4.20 Grok 4.20 none रिलीज़: 2026-03-31
स्कोर	5.1	5.2
रैंक	#117	#108
विश्वसनीयता	9.9	लागू नहीं
संगति	8.7	9.5
सही परीक्षण
प्रति प्रयास पास दर	33.3%	29.6%
अस्थिर टेस्ट	3	1
कुल रन	54	54
प्रति परिणाम लागत	0.000	1.889
कुल लागत	$0.000	$0.095
???? ???	$0.000 / 1M	$2.000 / 1M
????? ???	$0.000 / 1M	$6.000 / 1M
आउटपुट टोकन	2,870	1,967
रीजनिंग टोकन	0	0
प्रतिक्रिया समय (औसत)	2.79s	1.11s
प्रतिक्रिया समय (अधिकतम)	15.42s	6.04s
प्रतिक्रिया समय (कुल)	50.24s	20.02s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Laguna M.1	3.4	7.9	16.7%	1		1.23s	485	0
Grok 4.20	4.8	10.0	25.0%	0		501ms	267	0

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Laguna M.1	7.5	3.8	66.7%	1		2.93s	543	0
Grok 4.20	3.4	9.3	0.0%	0		1.22s	312	0

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Laguna M.1	3.0	10.0	0.0%	0		4.32s	622	0
Grok 4.20	3.0	10.0	0.0%	0		6.04s	282	0

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Laguna M.1	10.0	10.0	100.0%	0		3.37s	246	0
Grok 4.20	10.0	10.0	100.0%	0		522ms	207	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Laguna M.1	3.6	7.2	22.2%	1		5.50s	33	0
Grok 4.20	3.0	10.0	0.0%	0		687ms	325	0

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Laguna M.1	4.0	10.0	0.0%	0		3.08s	212	0
Grok 4.20	4.8	10.0	0.0%	0		659ms	83	0

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Laguna M.1	6.3	10.0	50.0%	0		683ms	80	0
Grok 4.20	4.8	10.0	0.0%	0		455ms	60	0

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Laguna M.1	3.2	10.0	0.0%	0		951ms	340	0
Grok 4.20	5.3	7.4	44.4%	1		487ms	242	0

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Laguna M.1	10.0	10.0	100.0%	0		7.54s	309	0
Grok 4.20	10.0	10.0	100.0%	0		4.63s	189	0

त्वरित तुलना

तुलना जोड़ी बदलें

Nemotron 3 Nano Omni 30b A3b Reasoningmediumनिःशुल्क उपलब्धvsGrok 4.20none Elephant AlphamediumvsGrok 4.20none MiniMax M2.7mediumvsGrok 4.20none Nemotron 3 Nano Omni 30b A3b Reasoningmediumनिःशुल्क उपलब्धvsLaguna M.1noneनिःशुल्क उपलब्ध Elephant AlphamediumvsLaguna M.1noneनिःशुल्क उपलब्ध MiniMax M2.7mediumvsLaguna M.1noneनिःशुल्क उपलब्ध Laguna M.1noneनिःशुल्क उपलब्धvsQwen3 Coder Nextmedium Mistral Small 4mediumvsGrok 4.20none Laguna M.1noneनिःशुल्क उपलब्धvsGLM 4.7 Flashmedium MiniMax M2.5mediumनिःशुल्क उपलब्धvsGrok 4.20none Qwen3 Coder NextmediumvsGrok 4.20none Mistral Small 4mediumvsLaguna M.1noneनिःशुल्क उपलब्ध