نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Owl Alpha

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-01

میٹرک GPT-5.4 Mini GPT-5.4 Mini none اجرا: 2026-03-17 Owl Alpha Owl Alpha medium اجرا: 2026-04-30
اسکور 5.1 5.8
درجہ #117 #92
اعتماد پذیری دستیاب نہیں 10.0
تسلسل 8.6 9.5
درست ٹیسٹس
فی کوشش کامیابی کی شرح 35.2% 40.7%
غیر مستحکم ٹیسٹ 3 1
کل رنز 54 54
فی نتیجہ لاگت 0.630 0.000
کل لاگت $0.032 $0.000
?? ?? ???? $0.750 / 1M $0.000 / 1M
??? ?? ???? $4.500 / 1M $0.000 / 1M
آؤٹ پٹ ٹوکنز 2,418 1,596
ریزننگ ٹوکنز 0 0
ردِعمل کا وقت (اوسط) 1.17s 11.04s
ردِعمل کا وقت (زیادہ سے زیادہ) 2.52s 58.63s
ردِعمل کا وقت (کل) 21.01s 198.65s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
Owl Alpha 4.8 10.0 25.0% 0 3.97s 87 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.19s 333 0
Owl Alpha 10.0 10.0 100.0% 0 7.35s 402 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
Owl Alpha 3.0 10.0 0.0% 0 10.01s 315 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
Owl Alpha 10.0 10.0 100.0% 0 21.64s 246 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
Owl Alpha 5.3 10.0 33.3% 0 8.58s 28 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
Owl Alpha 4.3 10.0 0.0% 0 58.63s 98 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
Owl Alpha 6.3 10.0 50.0% 0 9.59s 57 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
Owl Alpha 3.4 7.2 11.1% 1 3.44s 135 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0
Owl Alpha 10.0 10.0 100.0% 0 8.26s 228 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں