نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Inception: Mercury 2 vs OpenAI: gpt-oss-120b

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-22

میٹرک Mercury 2 Mercury 2 medium اجرا: 2026-02-24 gpt-oss-120b gpt-oss-120b none اجرا: 2025-08-05 مفت دستیاب
اسکور 6.3 5.2
درجہ #90 #129
اعتماد پذیری 10.0 10.0
تسلسل 8.4 8.7
درست ٹیسٹس
فی کوشش کامیابی کی شرح 50.0% 36.8%
غیر مستحکم ٹیسٹ 4 3
کل رنز 60 57
فی نتیجہ لاگت 0.687 0.201
کل لاگت $0.055 $0.011
?? ?? ???? $0.250 / 1M $0.000 / 1M
??? ?? ???? $0.750 / 1M $0.000 / 1M
آؤٹ پٹ ٹوکنز 4,015 51,505
ریزننگ ٹوکنز 58,382 0
ردِعمل کا وقت (اوسط) 2.27s 21.86s
ردِعمل کا وقت (زیادہ سے زیادہ) 14.63s 113.71s
ردِعمل کا وقت (کل) 43.15s 349.78s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
gpt-oss-120b 6.5 10.0 50.0% 0 32.84s 8,676 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 7.2 6.5 66.7% 1 2.29s 270 8,514
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
gpt-oss-120b 4.8 10.0 0.0% 0 10.79s 615 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
gpt-oss-120b 9.8 10.0 100.0% 0 5.10s 1,982 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 3.8 7.3 22.2% 1 934ms 354 2,758
gpt-oss-120b 4.4 4.5 44.5% 2 9.51s 3,781 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 3.0 10.0 0.0% 0 2.58s 22 3,748
gpt-oss-120b 3.0 10.0 0.0% 0 47.29s 3,138 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں