AI BENCHY तुलना

OpenAI: GPT-5.2 Chat vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-02

मेट्रिक	GPT-5.2 Chat GPT-5.2 Chat none रिलीज़: 2025-12-11	Grok 4.20 Grok 4.20 medium रिलीज़: 2026-03-31

मेट्रिक	GPT-5.2 Chat GPT-5.2 Chat none रिलीज़: 2025-12-11	Grok 4.20 Grok 4.20 medium रिलीज़: 2026-03-31
स्कोर	7.8	7.1
रैंक	#29	#40
संगति	8.6	8.2
सही परीक्षण
प्रति प्रयास पास दर	74.5%	66.7%
अस्थिर टेस्ट	3	4
कुल रन	51	51
प्रति परिणाम लागत	2.462	7.358
कुल लागत	$0.271	$0.663
???? ???	$1.750 / 1M	$2.000 / 1M
????? ???	$14.000 / 1M	$6.000 / 1M
आउटपुट टोकन	16,001	1,494
रीजनिंग टोकन	0	97,078
प्रतिक्रिया समय (औसत)	6.72s	9.50s
प्रतिक्रिया समय (अधिकतम)	38.52s	29.87s
प्रतिक्रिया समय (कुल)	114.20s	161.54s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2 Chat	8.7	7.9	91.7%	1		3.40s	1,807	0
Grok 4.20	8.2	7.9	83.3%	1		3.36s	280	8,476

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2 Chat	10.0	10.0	100.0%	0		9.12s	1,243	0
Grok 4.20	10.0	10.0	100.0%	0		17.40s	232	9,556

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2 Chat	10.0	10.0	100.0%	0		3.05s	980	0
Grok 4.20	10.0	10.0	100.0%	0		4.17s	180	5,333

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2 Chat	5.3	10.0	33.3%	0		17.78s	7,810	0
Grok 4.20	5.3	10.0	33.3%	0		27.03s	375	49,339

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2 Chat	4.4	3.0	33.3%	1		3.20s	335	0
Grok 4.20	5.8	2.8	66.7%	1		7.09s	47	4,252

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2 Chat	7.5	6.1	83.3%	1		5.46s	1,528	0
Grok 4.20	7.3	5.9	83.3%	1		4.42s	40	5,474

Puzzle Solving	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2 Chat	7.7	10.0	66.7%	0		4.42s	1,743	0
Grok 4.20	6.4	7.7	55.6%	1		3.89s	143	8,028

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2 Chat	10.0	10.0	100.0%	0		4.68s	555	0
Grok 4.20	3.0	10.0	0.0%	0		13.68s	197	6,620

त्वरित तुलना

तुलना जोड़ी बदलें

GPT-5.2 ChatnonevsStep 3.5 Flashmediumनिःशुल्क उपलब्ध GPT-5.2 ChatnonevsGLM 5V Turbomedium GPT-5.2 ChatnonevsGrok 4.20 Betamedium GPT-5.2 ChatnonevsMiMo-V2-Omnimedium Claude Sonnet 4.6mediumvsGPT-5.2 Chatnone Claude Sonnet 4.6nonevsGrok 4.20medium GPT-5.2 ChatnonevsMiMo-V2-Promedium GPT-5.2 ChatnonevsQwen3.5-Flashmedium GPT-5.2 ChatnonevsMiMo-V2-Flashmedium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsGLM 5 Turbomedium Claude Opus 4.6mediumvsGPT-5.2 Chatnone