نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

Inception: Mercury 2 vs Qwen: Qwen3.5-9B

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-26

میٹرک Mercury 2 Mercury 2 medium اجرا: 2026-02-24 Qwen3.5-9B Qwen3.5-9B none اجرا: 2026-03-02
اسکور 6.5 4.8
درجہ #65 #105
اعتماد پذیری دستیاب نہیں دستیاب نہیں
تسلسل 8.6 9.6
درست ٹیسٹس
فی کوشش کامیابی کی شرح 53.7% 24.1%
غیر مستحکم ٹیسٹ 3 1
کل رنز 54 54
فی نتیجہ لاگت 0.580 0.116
کل لاگت $0.047 $0.005
?? ?? ???? $0.250 / 1M $0.100 / 1M
??? ?? ???? $0.750 / 1M $0.150 / 1M
آؤٹ پٹ ٹوکنز 3,972 3,951
ریزننگ ٹوکنز 48,333 0
ردِعمل کا وقت (اوسط) 2.21s 1.47s
ردِعمل کا وقت (زیادہ سے زیادہ) 14.63s 5.91s
ردِعمل کا وقت (کل) 37.51s 26.43s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
Qwen3.5-9B 3.1 9.9 0.0% 0 1.71s 582 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 1.53s 249 2,213
Qwen3.5-9B 5.2 3.4 33.3% 1 5.69s 1,006 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
Qwen3.5-9B 3.0 10.0 0.0% 0 5.91s 1,255 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
Qwen3.5-9B 10.0 10.0 100.0% 0 847ms 249 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
Qwen3.5-9B 3.0 10.0 0.0% 0 464ms 24 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
Qwen3.5-9B 4.4 9.9 0.0% 0 552ms 99 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
Qwen3.5-9B 6.5 10.0 50.0% 0 514ms 75 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 3.9 7.5 22.2% 1 934ms 354 2,758
Qwen3.5-9B 3.2 9.9 0.0% 0 683ms 388 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
Qwen3.5-9B 10.0 10.0 100.0% 0 1.27s 273 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں