نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.4 vs OpenAI: gpt-oss-120b

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-22

میٹرک GPT-5.4 GPT-5.4 none اجرا: 2026-03-05 gpt-oss-120b gpt-oss-120b none اجرا: 2025-08-05 مفت دستیاب
اسکور 5.6 5.2
درجہ #112 #129
اعتماد پذیری 10.0 10.0
تسلسل 9.1 8.7
درست ٹیسٹس
فی کوشش کامیابی کی شرح 38.3% 36.8%
غیر مستحکم ٹیسٹ 2 3
کل رنز 60 57
فی نتیجہ لاگت 1.638 0.201
کل لاگت $0.115 $0.011
?? ?? ???? $2.500 / 1M $0.000 / 1M
??? ?? ???? $15.000 / 1M $0.000 / 1M
آؤٹ پٹ ٹوکنز 2,378 51,505
ریزننگ ٹوکنز 0 0
ردِعمل کا وقت (اوسط) 1.46s 21.86s
ردِعمل کا وقت (زیادہ سے زیادہ) 2.95s 113.71s
ردِعمل کا وقت (کل) 29.23s 349.78s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 3.2 8.0 8.3% 1 1.21s 406 0
gpt-oss-120b 6.5 10.0 50.0% 0 32.84s 8,676 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 6.8 10.0 50.0% 0 1.99s 501 0
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 3.0 10.0 0.0% 0 2.89s 291 0
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 10.0 10.0 100.0% 0 1.04s 222 0
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 5.3 7.2 44.4% 1 1.07s 50 0
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 4.4 9.9 0.0% 0 1.78s 184 0
gpt-oss-120b 4.8 10.0 0.0% 0 10.79s 615 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 6.5 10.0 50.0% 0 1.07s 81 0
gpt-oss-120b 9.8 10.0 100.0% 0 5.10s 1,982 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 5.6 9.8 33.3% 0 1.52s 357 0
gpt-oss-120b 4.4 4.5 44.5% 2 9.51s 3,781 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 3.0 10.0 0.0% 0 990ms 40 0
gpt-oss-120b 3.0 10.0 0.0% 0 47.29s 3,138 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں