AI BENCHY Compare
OpenAI: GPT-5.4 vs OpenAI: GPT-5.5
بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-24
| میٹرک | GPT-5.4 GPT-5.4 medium | GPT-5.5 GPT-5.5 medium |
|---|---|---|
| اسکور | 8.2 | 9.0 |
| درجہ | #18 | #5 |
| اعتماد پذیری | دستیاب نہیں | دستیاب نہیں |
| تسلسل | 8.7 | 9.2 |
| درست ٹیسٹس | ||
| فی کوشش کامیابی کی شرح | 79.6% | 87.0% |
| غیر مستحکم ٹیسٹ | 3 | 2 |
| کل رنز | 54 | 54 |
| فی نتیجہ لاگت | 6.399 | 19.226 |
| کل لاگت | $0.832 | $2.884 |
| ?? ?? ???? | $2.500 / 1M | $5.000 / 1M |
| ??? ?? ???? | $15.000 / 1M | $30.000 / 1M |
| آؤٹ پٹ ٹوکنز | 2,169 | 1,920 |
| ریزننگ ٹوکنز | 48,732 | 89,632 |
| ردِعمل کا وقت (اوسط) | 18.63s | 32.75s |
| ردِعمل کا وقت (زیادہ سے زیادہ) | 100.41s | 332.10s |
| ردِعمل کا وقت (کل) | 335.26s | 589.59s |
اسکور بمقابلہ کل لاگت
ردِعمل کا وقت (اوسط)
اسکور vs ردِعمل کا وقت (اوسط)
کل آؤٹ پٹ ٹوکنز
اسکور vs کل آؤٹ پٹ ٹوکنز
زمرہ وار تفصیل
فوری موازنہ
موازنہ کی جوڑی تبدیل کریں
GPT-5.4mediumvsHY3 Previewlowمفت دستیابGemini 3 Flash PreviewnonevsGPT-5.4mediumGemini 3.1 Flash Lite PreviewlowvsGPT-5.4mediumGemini 3 Flash PreviewlowvsGPT-5.5mediumClaude Opus 4.7nonevsGPT-5.5mediumGPT-5.4mediumvsHY3 Previewhighمفت دستیابGemini 3.1 Flash Lite PreviewnonevsGPT-5.4mediumDeepSeek V4 FlashhighvsGPT-5.4mediumGPT-5.5mediumvsHY3 Previewhighمفت دستیابGemini 3 Flash PreviewlowvsGPT-5.4mediumClaude Sonnet 4.6nonevsGPT-5.4mediumGPT-5.5mediumvsHY3 Previewlowمفت دستیاب