نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs OpenAI: GPT-5.4 Nano

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-17

میٹرک Mercury 2 Mercury 2 medium اجرا: 2026-02-24 GPT-5.4 Nano GPT-5.4 Nano none اجرا: 2026-03-17
درجہ #42 #73
اسکور 6.3 4.3
تسلسل 8.5 7.3
فی نتیجہ لاگت 0.634 0.404
کل لاگت $0.045 $0.009
درست ٹیسٹس
فی کوشش کامیابی کی شرح 51.0% 29.4%
غیر مستحکم ٹیسٹ 3 6
کل رنز 51 51
آؤٹ پٹ ٹوکنز 3,723 2,185
ریزننگ ٹوکنز 46,120 0
ردِعمل کا وقت (اوسط) 2.25s 1.39s
ردِعمل کا وقت (زیادہ سے زیادہ) 14.63s 3.84s
ردِعمل کا وقت (کل) 35.99s 23.70s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
GPT-5.4 Nano 3.5 8.0 16.7% 1 1.18s 800 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
GPT-5.4 Nano 3.0 10.0 0.0% 0 3.84s 280 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
GPT-5.4 Nano 6.5 10.0 50.0% 0 1.11s 219 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
GPT-5.4 Nano 2.9 4.4 22.2% 2 926ms 52 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
GPT-5.4 Nano 3.8 2.5 33.3% 1 1.31s 180 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
GPT-5.4 Nano 5.0 6.8 33.3% 1 787ms 84 0
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 3.9 7.5 22.2% 1 934ms 354 2,758
GPT-5.4 Nano 3.7 7.3 22.2% 1 1.29s 348 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
GPT-5.4 Nano 10.0 10.0 100.0% 0 3.40s 222 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں