نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs Xiaomi: MiMo-V2.5-Pro

خلاصہ

Mercury 2 vs MiMo-V2.5-Pro benchmark موازنہ: Mercury 2 average score میں آگے ہے: 7.5 vs 7.4. Mercury 2 کی benchmark لاگت کم ہے: $0.058 vs $0.106. Mercury 2 تیز ہے: 2.24s vs 26.13s، pass rates 54.0% vs 68.3%.

تجویز کردہ ماڈل: Mercury 2 - It has the best score here (7.5), while costing about 1.8x less than MiMo-V2.5-Pro.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-12

میٹرک Mercury 2 Mercury 2 medium اجرا: 2026-02-24 MiMo-V2.5-Pro MiMo-V2.5-Pro medium اجرا: 2026-04-22
اسکور 7.5 7.4
درجہ #46 #52
اعتماد پذیری 10.0 10.0
تسلسل 8.8 8.5
درست ٹیسٹس
فی کوشش کامیابی کی شرح 54.0% 68.3%
غیر مستحکم ٹیسٹ 3 4
کل رنز 63 63
فی نتیجہ لاگت 0.578 2.541
کل لاگت $0.058 $0.106
ان پٹ قیمت $0.250 / 1M $0.435 / 1M
آؤٹ پٹ قیمت $0.750 / 1M $0.870 / 1M
کل ان پٹ ٹوکنز 35,116 40,854
آؤٹ پٹ ٹوکنز 4,048 5,015
ریزننگ ٹوکنز 61,219 97,742
ردِعمل کا وقت (اوسط) 2.24s 26.13s
ردِعمل کا وقت (زیادہ سے زیادہ) 14.63s 130.77s
ردِعمل کا وقت (کل) 44.72s 548.65s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#46 Mercury 2

medium
Cost
$0.002
Time
2.1s
Tokens
1,702 tok

#52 MiMo-V2.5-Pro

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 6.9 9.9 50.0% 0 1.12s 554 2,546 2,609
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.26s 621 323 1,179
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 8.2 7.7 77.8% 1 2.04s 7,065 296 11,328
MiMo-V2.5-Pro 6.2 4.7 66.7% 2 92.07s 6,543 780 51,218
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 3.28s 12,909 268 4,887
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 15,060 348 11,870
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 7.3 5.9 83.3% 1 1.11s 6,234 183 1,656
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 7,746 260 8,383
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 2.9 7.2 11.1% 1 6.48s 695 41 30,754
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 630 275 17,023
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 4.8 10.0 0.0% 0 821ms 456 137 542
MiMo-V2.5-Pro 5.5 10.0 0.0% 0 4.02s 492 155 163
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 1.07s 340 14 958
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 672 82 803
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 5.4 10.0 33.3% 0 949ms 601 361 2,781
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.31s 660 540 2,181
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 1.89s 6,080 180 1,956
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 8,220 311 2,908
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 3.0 10.0 0.0% 0 2.58s 182 22 3,748
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 12.46s 210 1,941 2,014

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں