نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.2 vs OpenAI: GPT-5.3 Chat

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-04

میٹرک GPT-5.2 GPT-5.2 medium اجرا: 2025-12-11 GPT-5.3 Chat GPT-5.3 Chat none اجرا: 2026-03-03
اسکور 7.3 7.6
درجہ #37 #33
تسلسل 8.0 8.6
درست ٹیسٹس
فی کوشش کامیابی کی شرح 70.6% 66.7%
غیر مستحکم ٹیسٹ 4 3
کل رنز 51 51
فی نتیجہ لاگت 3.131 3.177
کل لاگت $0.314 $0.318
?? ?? ???? $1.750 / 1M $1.750 / 1M
??? ?? ???? $14.000 / 1M $14.000 / 1M
آؤٹ پٹ ٹوکنز 2,238 19,348
ریزننگ ٹوکنز 16,811 0
ردِعمل کا وقت (اوسط) 13.93s 5.68s
ردِعمل کا وقت (زیادہ سے زیادہ) 77.80s 18.33s
ردِعمل کا وقت (کل) 139.29s 96.58s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 6.5 8.0 58.3% 1 7.81s 567 2,002
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 10.0 10.0 100.0% 0 14.06s 291 1,757
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 10.0 10.0 100.0% 0 3.15s 234 420
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 5.9 7.2 55.6% 1 77.80s 42 10,342
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 3.7 9.7 0.0% 0 4.32s 162 269
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 9.9 10.0 100.0% 0 3.12s 94 614
GPT-5.3 Chat 8.3 10.0 50.0% 0 3.29s 1,455 0
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 7.7 7.3 77.8% 1 5.47s 609 938
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 4.7 1.6 66.7% 1 10.30s 239 469
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں