نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 vs OpenAI: GPT-5.5

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-24

میٹرک GPT-5.4 GPT-5.4 medium اجرا: 2026-03-05 GPT-5.5 GPT-5.5 medium اجرا: 2026-04-24
اسکور 8.2 9.0
درجہ #18 #5
اعتماد پذیری دستیاب نہیں دستیاب نہیں
تسلسل 8.7 9.2
درست ٹیسٹس
فی کوشش کامیابی کی شرح 79.6% 87.0%
غیر مستحکم ٹیسٹ 3 2
کل رنز 54 54
فی نتیجہ لاگت 6.399 19.226
کل لاگت $0.832 $2.884
?? ?? ???? $2.500 / 1M $5.000 / 1M
??? ?? ???? $15.000 / 1M $30.000 / 1M
آؤٹ پٹ ٹوکنز 2,169 1,920
ریزننگ ٹوکنز 48,732 89,632
ردِعمل کا وقت (اوسط) 18.63s 32.75s
ردِعمل کا وقت (زیادہ سے زیادہ) 100.41s 332.10s
ردِعمل کا وقت (کل) 335.26s 589.59s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 8.3 10.0 75.0% 0 4.11s 240 1,511
GPT-5.5 10.0 10.0 100.0% 0 4.66s 250 1,335
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 10.0 10.0 100.0% 0 13.03s 389 2,045
GPT-5.5 10.0 10.0 100.0% 0 9.09s 318 1,391
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
GPT-5.5 10.0 10.0 100.0% 0 19.29s 312 2,841
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
GPT-5.5 10.0 10.0 100.0% 0 4.18s 234 593
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
GPT-5.5 5.3 7.2 44.4% 1 164.14s 67 79,625
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
GPT-5.5 10.0 10.0 100.0% 0 4.16s 138 223
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
GPT-5.5 10.0 10.0 100.0% 0 3.36s 93 538
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
GPT-5.5 8.6 7.9 77.8% 1 6.78s 250 2,254
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
GPT-5.5 10.0 10.0 100.0% 0 10.57s 258 832

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں