AI BENCHY तुलना

Elephant vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-14

मेट्रिक	Elephant Elephant none रिलीज़: 2026-04-14	Grok 4.20 Grok 4.20 medium रिलीज़: 2026-03-31

मेट्रिक	Elephant Elephant none रिलीज़: 2026-04-14	Grok 4.20 Grok 4.20 medium रिलीज़: 2026-03-31
स्कोर	5.2	7.0
रैंक	#81	#44
संगति	9.6	7.8
सही परीक्षण
प्रति प्रयास पास दर	31.5%	66.7%
अस्थिर टेस्ट	1	5
कुल रन	54	54
प्रति परिणाम लागत	0.000	8.252
कुल लागत	$0.000	$0.743
???? ???	$0.000 / 1M	$2.000 / 1M
????? ???	$0.000 / 1M	$6.000 / 1M
आउटपुट टोकन	2,573	1,744
रीजनिंग टोकन	0	109,882
प्रतिक्रिया समय (औसत)	1.23s	10.33s
प्रतिक्रिया समय (अधिकतम)	3.81s	29.87s
प्रतिक्रिया समय (कुल)	22.16s	185.87s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Elephant	6.6	10.0	50.0%	0		963ms	610	0
Grok 4.20	8.2	7.9	83.3%	1		3.36s	280	8,476

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Elephant	6.4	3.3	66.7%	1		1.39s	375	0
Grok 4.20	4.3	1.1	66.7%	1		24.33s	250	12,804

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Elephant	3.0	10.0	0.0%	0		3.81s	731	0
Grok 4.20	10.0	10.0	100.0%	0		17.40s	232	9,556

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Elephant	6.5	10.0	50.0%	0		1.04s	246	0
Grok 4.20	10.0	10.0	100.0%	0		4.17s	180	5,333

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Elephant	3.0	10.0	0.0%	0		927ms	24	0
Grok 4.20	5.3	10.0	33.3%	0		27.03s	375	49,339

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Elephant	4.0	10.0	0.0%	0		854ms	106	0
Grok 4.20	5.8	2.8	66.7%	1		7.09s	47	4,252

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Elephant	9.8	10.0	100.0%	0		1.03s	81	0
Grok 4.20	7.3	5.9	83.3%	1		4.42s	40	5,474

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Elephant	3.3	10.0	0.0%	0		849ms	170	0
Grok 4.20	6.4	7.7	55.6%	1		3.89s	143	8,028

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Elephant	3.0	10.0	0.0%	0		2.79s	230	0
Grok 4.20	3.0	10.0	0.0%	0		13.68s	197	6,620

त्वरित तुलना

तुलना जोड़ी बदलें

Gemma 4 31Bnoneनिःशुल्क उपलब्धvsGrok 4.20medium MiniMax M2.7mediumvsElephantnone Qwen3.5 Plus 2026-02-15nonevsGrok 4.20medium Grok 4.20mediumvsGLM 5none Claude Sonnet 4.6nonevsGrok 4.20medium Mistral Small 4mediumvsElephantnone ElephantnonevsQwen3 Coder Nextmedium MiniMax M2.5mediumनिःशुल्क उपलब्धvsElephantnone Grok 4.20mediumvsMiMo-V2-Omninone ElephantnonevsGLM 4.7 Flashmedium gpt-oss-120bmediumनिःशुल्क उपलब्धvsElephantnone GPT-5.3 ChatnonevsGrok 4.20medium