نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Inception: Mercury 2 vs Qwen: Qwen3.5-122B-A10B

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-03

میٹرک Mercury 2 Mercury 2 none اجرا: 2026-02-24 Qwen3.5-122B-A10B Qwen3.5-122B-A10B none اجرا: 2026-02-24
اسکور 4.6 5.4
درجہ #153 #131
اعتماد پذیری 10.0 10.0
تسلسل 9.1 9.5
درست ٹیسٹس
فی کوشش کامیابی کی شرح 25.0% 33.3%
غیر مستحکم ٹیسٹ 2 1
کل رنز 60 60
فی نتیجہ لاگت 0.216 0.380
کل لاگت $0.009 $0.019
ان پٹ قیمت $0.250 / 1M $0.260 / 1M
آؤٹ پٹ قیمت $0.750 / 1M $2.080 / 1M
کل ان پٹ ٹوکنز 25,515 44,894
آؤٹ پٹ ٹوکنز 3,001 3,374
ریزننگ ٹوکنز 0 0
ردِعمل کا وقت (اوسط) 614ms 3.38s
ردِعمل کا وقت (زیادہ سے زیادہ) 1.27s 46.00s
ردِعمل کا وقت (کل) 12.28s 67.55s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
Qwen3.5-122B-A10B 4.8 10.0 25.0% 0 1.59s 696 312 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 3.5 9.4 0.0% 0 831ms 4,631 1,650 0
Qwen3.5-122B-A10B 4.0 5.5 33.3% 1 2.14s 5,072 684 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 46.00s 20,175 1,137 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 1.01s 7,794 243 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
Qwen3.5-122B-A10B 5.3 10.0 33.3% 0 465ms 789 15 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
Qwen3.5-122B-A10B 5.0 10.0 0.0% 0 1.12s 522 66 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
Qwen3.5-122B-A10B 6.3 10.0 50.0% 0 513ms 711 69 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
Qwen3.5-122B-A10B 3.8 10.0 0.0% 0 1.00s 714 575 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 2.04s 8,211 264 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 295ms 210 9 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں