نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

Inception: Mercury 2 vs OpenAI: GPT-5.5

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-24

میٹرک Mercury 2 Mercury 2 medium اجرا: 2026-02-24 GPT-5.5 GPT-5.5 none اجرا: 2026-04-24
اسکور 6.5 6.8
درجہ #64 #58
اعتماد پذیری دستیاب نہیں دستیاب نہیں
تسلسل 8.6 8.3
درست ٹیسٹس
فی کوشش کامیابی کی شرح 53.7% 61.1%
غیر مستحکم ٹیسٹ 3 4
کل رنز 54 54
فی نتیجہ لاگت 0.580 2.162
کل لاگت $0.047 $0.195
?? ?? ???? $0.250 / 1M $5.000 / 1M
??? ?? ???? $0.750 / 1M $30.000 / 1M
آؤٹ پٹ ٹوکنز 3,972 1,910
ریزننگ ٹوکنز 48,333 0
ردِعمل کا وقت (اوسط) 2.21s 1.83s
ردِعمل کا وقت (زیادہ سے زیادہ) 14.63s 5.56s
ردِعمل کا وقت (کل) 37.51s 32.86s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
GPT-5.5 6.9 7.9 66.7% 1 1.31s 213 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 1.53s 249 2,213
GPT-5.5 10.0 10.0 100.0% 0 2.05s 426 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
GPT-5.5 3.0 10.0 0.0% 0 5.56s 300 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
GPT-5.5 10.0 10.0 100.0% 0 1.18s 222 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
GPT-5.5 2.9 7.2 11.1% 1 1.31s 52 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
GPT-5.5 10.0 10.0 100.0% 0 3.41s 124 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
GPT-5.5 6.2 5.8 66.7% 1 1.15s 81 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 3.9 7.5 22.2% 1 934ms 354 2,758
GPT-5.5 6.7 7.9 55.6% 1 1.36s 245 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
GPT-5.5 10.0 10.0 100.0% 0 3.90s 247 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں