AI BENCHY तुलना

DeepSeek: DeepSeek V3.2 vs xAI: Grok 4.20 Beta

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-12

मेट्रिक	DeepSeek V3.2 DeepSeek V3.2 none रिलीज़: 2025-12-01	Grok 4.20 Beta Grok 4.20 Beta medium रिलीज़: 2026-03-12

मेट्रिक	DeepSeek V3.2 DeepSeek V3.2 none रिलीज़: 2025-12-01	Grok 4.20 Beta Grok 4.20 Beta medium रिलीज़: 2026-03-12
रैंक	#37	#24
औसत स्कोर	5.5	7.0
संगति	8.4	9.0
प्रति परिणाम लागत	0.220	5.989
कुल लागत	$0.016	$0.599
सही परीक्षण
प्रति प्रयास पास दर	54.2%	70.8%
अस्थिर टेस्ट	3	2
कुल रन	48	48
आउटपुट टोकन	7,823	1,481
रीजनिंग टोकन	0	86,628
प्रतिक्रिया समय (औसत)	12.86s	8.89s
प्रतिक्रिया समय (अधिकतम)	115.89s	24.21s
प्रतिक्रिया समय (कुल)	205.78s	142.18s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

औसत स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
DeepSeek V3.2	10.0	9.7	0.0%	0		8.79s	1,411	0
Grok 4.20 Beta	7.0	7.2	88.9%	1		3.19s	262	6,289

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
DeepSeek V3.2	8.0	10.0	0.0%	0		115.89s	2,887	0
Grok 4.20 Beta	10.0	10.0	100.0%	0		20.93s	227	12,212

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
DeepSeek V3.2	5.4	5.8	66.7%	1		9.42s	1,710	0
Grok 4.20 Beta	9.9	10.0	100.0%	0		4.01s	180	5,281

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
DeepSeek V3.2	10.0	7.2	22.2%	1		1.61s	24	0
Grok 4.20 Beta	4.0	10.0	33.3%	0		21.33s	251	40,255

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
DeepSeek V3.2	10.0	10.0	100.0%	0		2.86s	67	0
Grok 4.20 Beta	10.0	10.0	100.0%	0		5.78s	72	3,440

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
Grok 4.20 Beta	9.0	10.0	50.0%	0		4.97s	57	7,107

Puzzle Solving	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
DeepSeek V3.2	7.7	7.5	88.9%	1		7.37s	1,136	0
Grok 4.20 Beta	7.0	7.2	88.9%	1		3.85s	249	6,660

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
Grok 4.20 Beta	10.0	10.0	0.0%	0		12.39s	183	5,384

त्वरित तुलना

तुलना जोड़ी बदलें

DeepSeek V3.2nonevsGPT-5 Nanomedium DeepSeek V3.2nonevsQwen3.5-35B-A3Bmedium Gemini 3.1 Flash Lite PreviewnonevsGrok 4.20 Betamedium Gemini 3 Flash PreviewnonevsGrok 4.20 Betamedium Claude Sonnet 4.6nonevsGrok 4.20 Betamedium DeepSeek V3.2nonevsMercury 2medium DeepSeek V3.2nonevsNemotron 3 Super 120b A12bmediumनिःशुल्क उपलब्ध GPT-5.3 ChatnonevsGrok 4.20 Betamedium Gemini 3.1 Flash Lite PreviewlowvsGrok 4.20 Betamedium DeepSeek V3.2nonevsHunter Alphamedium DeepSeek V3.2nonevsgpt-oss-120bmediumनिःशुल्क उपलब्ध GPT-5.2 ChatnonevsGrok 4.20 Betamedium