نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 vs HY3 Preview

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-23

میٹرک GPT-5.4 GPT-5.4 medium اجرا: 2026-03-05 HY3 Preview HY3 Preview low اجرا: 2026-04-22 مفت دستیاب
اسکور 8.2 8.1
درجہ #17 #22
تسلسل 8.7 9.5
درست ٹیسٹس
فی کوشش کامیابی کی شرح 79.6% 75.9%
غیر مستحکم ٹیسٹ 3 1
کل رنز 54 50
فی نتیجہ لاگت 6.399 0.000
کل لاگت $0.832 $0.000
?? ?? ???? $2.500 / 1M $0.000 / 1M
??? ?? ???? $15.000 / 1M $0.000 / 1M
آؤٹ پٹ ٹوکنز 2,169 65,778
ریزننگ ٹوکنز 48,732 0
ردِعمل کا وقت (اوسط) 18.63s 23.98s
ردِعمل کا وقت (زیادہ سے زیادہ) 100.41s 78.74s
ردِعمل کا وقت (کل) 335.26s 407.72s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 8.3 10.0 75.0% 0 4.11s 240 1,511
HY3 Preview 10.0 10.0 100.0% 0 16.61s 7,905 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 10.0 10.0 100.0% 0 13.03s 389 2,045
HY3 Preview 10.0 10.0 100.0% 0 27.94s 7,907 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
HY3 Preview 10.0 10.0 100.0% 0 78.74s 12,975 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
HY3 Preview 6.5 10.0 50.0% 0 5.85s 1,022 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
HY3 Preview 5.9 7.2 55.6% 1 40.44s 23,121 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
HY3 Preview 10.0 10.0 100.0% 0 16.44s 2,185 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
HY3 Preview 10.0 10.0 100.0% 0 15.98s 2,475 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
HY3 Preview 5.3 10.0 33.3% 0 13.73s 6,985 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
HY3 Preview 10.0 10.0 100.0% 0 17.84s 1,203 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں