نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Inception: Mercury 2 vs Qwen: Qwen3.5-122B-A10B

خلاصہ

Mercury 2 vs Qwen3.5-122B-A10B benchmark موازنہ: Qwen3.5-122B-A10B average score میں آگے ہے: 7.7 vs 7.5. Mercury 2 کی benchmark لاگت کم ہے: $0.058 vs $0.588. Mercury 2 تیز ہے: 2.24s vs 42.49s، pass rates 54.0% vs 73.0%.

تجویز کردہ ماڈل: Mercury 2 - Its score stays close to the best score here (7.5 vs 7.7), while costing about 10.2x less than Qwen3.5-122B-A10B.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-18

میٹرک Mercury 2 Mercury 2 medium اجرا: 2026-02-24 Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium اجرا: 2026-02-24
اسکور 7.5 7.7
درجہ #44 #36
اعتماد پذیری 10.0 10.0
تسلسل 8.8 8.8
درست ٹیسٹس
فی کوشش کامیابی کی شرح 54.0% 73.0%
غیر مستحکم ٹیسٹ 3 3
کل رنز 63 63
فی نتیجہ لاگت 0.578 5.235
کل لاگت $0.058 $0.588
ان پٹ قیمت $0.250 / 1M $0.260 / 1M
آؤٹ پٹ قیمت $0.750 / 1M $2.080 / 1M
کل ان پٹ ٹوکنز 35,116 41,832
آؤٹ پٹ ٹوکنز 4,048 26,187
ریزننگ ٹوکنز 61,219 251,028
ردِعمل کا وقت (اوسط) 2.24s 42.49s
ردِعمل کا وقت (زیادہ سے زیادہ) 14.63s 168.16s
ردِعمل کا وقت (کل) 44.72s 892.30s

جنریشن شوکیس

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#44 Mercury 2

medium
لاگت
$0.002
وقت
2.1s
ٹوکنز
1,702 tok

#36 Qwen3.5-122B-A10B

medium
لاگت
$0.019
وقت
48.7s
ٹوکنز
6,034 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 6.9 9.9 50.0% 0 1.12s 554 2,546 2,609
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.75s 672 269 16,835
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 8.2 7.7 77.8% 1 2.04s 7,065 296 11,328
Qwen3.5-122B-A10B 6.0 7.2 55.6% 1 114.48s 7,630 8,057 82,578
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 3.28s 12,909 268 4,887
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 107.79s 14,947 483 11,337
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 7.3 5.9 83.3% 1 1.11s 6,234 183 1,656
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 23.41s 7,782 270 16,558
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 2.9 7.2 11.1% 1 6.48s 695 41 30,754
Qwen3.5-122B-A10B 2.9 7.2 11.1% 1 63.40s 771 15,537 64,889
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 4.8 10.0 0.0% 0 821ms 456 137 542
Qwen3.5-122B-A10B 3.4 2.2 33.3% 1 34.11s 344 66 7,592
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 1.07s 340 14 958
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.88s 593 77 7,372
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 5.4 10.0 33.3% 0 949ms 601 361 2,781
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 17.89s 696 284 27,575
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 1.89s 6,080 180 1,956
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 4.60s 8,193 322 1,226
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 3.0 10.0 0.0% 0 2.58s 182 22 3,748
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 52.87s 204 822 15,066

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں