نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs Qwen: Qwen3.5-9B

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-26

میٹرک Mercury 2 Mercury 2 none اجرا: 2026-02-24 Qwen3.5-9B Qwen3.5-9B medium اجرا: 2026-03-02
اسکور 4.8 4.4
درجہ #106 #114
اعتماد پذیری دستیاب نہیں دستیاب نہیں
تسلسل 9.0 7.2
درست ٹیسٹس
فی کوشش کامیابی کی شرح 27.8% 33.3%
غیر مستحکم ٹیسٹ 2 6
کل رنز 54 54
فی نتیجہ لاگت 0.165 0.976
کل لاگت $0.007 $0.030
?? ?? ???? $0.250 / 1M $0.100 / 1M
??? ?? ???? $0.750 / 1M $0.150 / 1M
آؤٹ پٹ ٹوکنز 1,625 24,291
ریزننگ ٹوکنز 0 172,597
ردِعمل کا وقت (اوسط) 613ms 73.64s
ردِعمل کا وقت (زیادہ سے زیادہ) 1.27s 226.38s
ردِعمل کا وقت (کل) 11.04s 1104.60s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 3.0 10.0 0.0% 0 483ms 286 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 2,621 12,411
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 3.6 8.9 0.0% 0 969ms 310 0
Qwen3.5-9B 2.6 10.0 0.0% 0 135.61s 6,150 31,393
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 3.0 10.0 0.0% 0 606ms 131 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 7.3 5.9 83.3% 1 667ms 180 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 1,383 32,113
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 5.3 7.2 44.4% 1 534ms 46 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 11,549 48,475
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 4.8 10.0 0.0% 0 628ms 159 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 0 30,695
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 6.5 10.0 50.0% 0 551ms 82 0
Qwen3.5-9B 6.4 5.8 66.7% 1 17.15s 599 4,517
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 3.1 10.0 0.0% 0 533ms 234 0
Qwen3.5-9B 3.1 10.0 0.0% 0 33.38s 1,545 11,844
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 444 1,149

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں