نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs OpenAI: GPT-5.4

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-01

میٹرک GPT-5.2 Chat GPT-5.2 Chat none اجرا: 2025-12-11 GPT-5.4 GPT-5.4 medium اجرا: 2026-03-05
اسکور 7.9 7.9
درجہ #32 #29
اعتماد پذیری 10.0 10.0
تسلسل 8.9 8.5
درست ٹیسٹس
فی کوشش کامیابی کی شرح 73.3% 75.0%
غیر مستحکم ٹیسٹ 3 4
کل رنز 60 60
فی نتیجہ لاگت 2.703 8.765
کل لاگت $0.352 $1.140
ان پٹ قیمت $1.750 / 1M $2.500 / 1M
آؤٹ پٹ قیمت $14.000 / 1M $15.000 / 1M
آؤٹ پٹ ٹوکنز 21,144 2,221
ریزننگ ٹوکنز 0 68,486
ردِعمل کا وقت (اوسط) 6.82s 22.31s
ردِعمل کا وقت (زیادہ سے زیادہ) 38.52s 100.41s
ردِعمل کا وقت (کل) 136.34s 446.17s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 1,807 0
GPT-5.4 8.3 10.0 75.0% 0 4.11s 240 1,511
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 8.2 6.7 83.3% 1 8.05s 4,131 0
GPT-5.4 8.2 6.7 83.3% 1 54.98s 412 19,995
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 980 0
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 7,810 0
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 335 0
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 9.8 10.0 100.0% 0 5.51s 1,441 0
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.10s 1,603 0
GPT-5.4 8.2 7.2 88.9% 1 9.14s 441 3,815
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 3.0 10.0 0.0% 0 6.89s 1,239 0
GPT-5.4 3.0 10.0 0.0% 0 13.95s 30 1,821

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں