AI BENCHY Compare
OpenAI: GPT-5.2 vs xAI: Grok 4.20
بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-10
| میٹرک | GPT-5.2 GPT-5.2 medium | Grok 4.20 Grok 4.20 medium |
|---|---|---|
| اسکور | 7.2 | 6.9 |
| درجہ | #60 | #68 |
| اعتماد پذیری | 10.0 | 10.0 |
| تسلسل | 8.2 | 8.3 |
| درست ٹیسٹس | ||
| فی کوشش کامیابی کی شرح | 68.4% | 63.2% |
| غیر مستحکم ٹیسٹ | 4 | 4 |
| کل رنز | 57 | 57 |
| فی نتیجہ لاگت | 3.609 | 7.559 |
| کل لاگت | $0.397 | $0.756 |
| ?? ?? ???? | $1.750 / 1M | $1.250 / 1M |
| ??? ?? ???? | $14.000 / 1M | $2.500 / 1M |
| آؤٹ پٹ ٹوکنز | 2,731 | 1,784 |
| ریزننگ ٹوکنز | 22,200 | 128,233 |
| ردِعمل کا وقت (اوسط) | 15.22s | 14.53s |
| ردِعمل کا وقت (زیادہ سے زیادہ) | 77.80s | 63.48s |
| ردِعمل کا وقت (کل) | 182.59s | 276.06s |
اسکور بمقابلہ کل لاگت
ردِعمل کا وقت (اوسط)
اسکور vs ردِعمل کا وقت (اوسط)
کل آؤٹ پٹ ٹوکنز
اسکور vs کل آؤٹ پٹ ٹوکنز
زمرہ وار تفصیل
فوری موازنہ
موازنہ کی جوڑی تبدیل کریں
DeepSeek V4 ProhighvsGrok 4.20mediumGemma 4 31Bnoneمفت دستیابvsGrok 4.20mediumClaude Sonnet 4.6nonevsGPT-5.2mediumRing 2.6 1tnoneمفت دستیابvsGPT-5.2mediumGemini 3.1 Flash LiteminimalvsGrok 4.20mediumGPT-5.2mediumvsQwen3.6 Max PreviewnoneGPT-5.5nonevsGrok 4.20mediumGemini 3.1 Flash LitenonevsGrok 4.20mediumQwen3.5 Plus 2026-02-15nonevsGrok 4.20mediumClaude Sonnet 4.6nonevsGrok 4.20mediumGemma 4 31Bnoneمفت دستیابvsGPT-5.2mediumDeepSeek V4 FlashhighvsGPT-5.2medium