AI BENCHY Compare
OpenAI: GPT-5.4 vs xAI: Grok 4.20
بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-02
| میٹرک | GPT-5.4 GPT-5.4 none | Grok 4.20 Grok 4.20 none |
|---|---|---|
| اسکور | 5.6 | 5.4 |
| درجہ | #64 | #69 |
| تسلسل | 9.0 | 9.5 |
| درست ٹیسٹس | ||
| فی کوشش کامیابی کی شرح | 39.2% | 31.4% |
| غیر مستحکم ٹیسٹ | 2 | 1 |
| کل رنز | 51 | 51 |
| فی نتیجہ لاگت | 1.573 | 1.809 |
| کل لاگت | $0.095 | $0.091 |
| ?? ?? ???? | $2.500 / 1M | $2.000 / 1M |
| ??? ?? ???? | $15.000 / 1M | $6.000 / 1M |
| آؤٹ پٹ ٹوکنز | 1,837 | 1,655 |
| ریزننگ ٹوکنز | 0 | 0 |
| ردِعمل کا وقت (اوسط) | 1.43s | 1.11s |
| ردِعمل کا وقت (زیادہ سے زیادہ) | 2.89s | 6.04s |
| ردِعمل کا وقت (کل) | 24.27s | 18.80s |
اسکور بمقابلہ کل لاگت
ردِعمل کا وقت (اوسط)
اسکور vs ردِعمل کا وقت (اوسط)
کل آؤٹ پٹ ٹوکنز
اسکور vs کل آؤٹ پٹ ٹوکنز
زمرہ وار تفصیل
فوری موازنہ
موازنہ کی جوڑی تبدیل کریں
Mistral Small 4mediumvsGPT-5.4noneMistral Small 4mediumvsGrok 4.20noneMiniMax M2.5mediumمفت دستیابvsGPT-5.4noneMiniMax M2.7mediumvsGrok 4.20noneMiniMax M2.5mediumمفت دستیابvsGrok 4.20noneQwen3 Coder NextmediumvsGrok 4.20noneGPT-5.4nonevsGrok 4.20 Multi Agent Betamediumgpt-oss-120bmediumمفت دستیابvsGrok 4.20noneMiniMax M2.7mediumvsGPT-5.4noneMercury 2mediumvsGPT-5.4noneGrok 4.20nonevsGLM 4.7 FlashmediumGPT-5.4nonevsQwen3 Coder Nextmedium