AI BENCHY Compare
OpenAI: GPT-5.4 vs Owl Alpha
بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-30
| میٹرک | GPT-5.4 GPT-5.4 none | Owl Alpha Owl Alpha medium |
|---|---|---|
| اسکور | 5.9 | 5.8 |
| درجہ | #89 | #91 |
| اعتماد پذیری | دستیاب نہیں | 10.0 |
| تسلسل | 9.1 | 9.5 |
| درست ٹیسٹس | ||
| فی کوشش کامیابی کی شرح | 42.6% | 40.7% |
| غیر مستحکم ٹیسٹ | 2 | 1 |
| کل رنز | 54 | 54 |
| فی نتیجہ لاگت | 1.477 | 0.000 |
| کل لاگت | $0.104 | $0.000 |
| ?? ?? ???? | $2.500 / 1M | $0.000 / 1M |
| ??? ?? ???? | $15.000 / 1M | $0.000 / 1M |
| آؤٹ پٹ ٹوکنز | 2,317 | 1,596 |
| ریزننگ ٹوکنز | 0 | 0 |
| ردِعمل کا وقت (اوسط) | 1.51s | 11.04s |
| ردِعمل کا وقت (زیادہ سے زیادہ) | 2.95s | 58.63s |
| ردِعمل کا وقت (کل) | 27.21s | 198.65s |
اسکور بمقابلہ کل لاگت
ردِعمل کا وقت (اوسط)
اسکور vs ردِعمل کا وقت (اوسط)
کل آؤٹ پٹ ٹوکنز
اسکور vs کل آؤٹ پٹ ٹوکنز
زمرہ وار تفصیل
فوری موازنہ
موازنہ کی جوڑی تبدیل کریں
Kimi K2.6nonevsOwl AlphamediumOwl AlphamediumvsQwen3.5-122B-A10BnoneOwl AlphamediumvsQwen3.5 Plus 2026-04-20noneOwl AlphamediumvsMiMo-V2.5-PrononeOwl AlphamediumvsQwen3.6 FlashnoneOwl AlphamediumvsGLM 5.1noneOwl AlphamediumvsMiMo-V2-PrononeDeepSeek V3.2nonevsOwl AlphamediumOwl AlphamediumvsQwen3.5-27BnoneOwl AlphamediumvsQwen3.6 27BnoneDeepSeek V4 PrononevsOwl AlphamediumMistral Small 4mediumvsGPT-5.4none