نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs Qwen: Qwen3.5-122B-A10B

موازنہ کریں:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-05

میٹرک Inception: Mercury 2 medium اجرا: 2026-02-24 Qwen: Qwen3.5-122B-A10B none اجرا: 2026-02-24
درجہ #35 #39
اوسط اسکور 54 51
تسلسل 83 96
فی نتیجہ لاگت 0.622 0.328
کل لاگت $0.044 $0.020
درست ٹیسٹس
فی کوشش کامیابی کی شرح 57.8% 42.2%
غیر مستحکم ٹیسٹ 3 1
آؤٹ پٹ ٹوکنز 3,571 2,613
ریزننگ ٹوکنز 45,379 0

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Inception: Mercury 2 73 98 66.7% 0 2,531 2,410
Qwen: Qwen3.5-122B-A10B 40 100 33.3% 0 309 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Inception: Mercury 2 100 100 100.0% 0 268 4,887
Qwen: Qwen3.5-122B-A10B 100 100 0.0% 0 1,137 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Inception: Mercury 2 55 59 83.3% 1 183 1,656
Qwen: Qwen3.5-122B-A10B 99 100 100.0% 0 243 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Inception: Mercury 2 100 72 11.1% 1 41 30,754
Qwen: Qwen3.5-122B-A10B 40 100 33.3% 0 15 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Inception: Mercury 2 100 100 100.0% 0 14 958
Qwen: Qwen3.5-122B-A10B 45 68 16.7% 1 70 0
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Inception: Mercury 2 17 75 22.2% 1 354 2,758
Qwen: Qwen3.5-122B-A10B 40 100 33.3% 0 575 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Inception: Mercury 2 100 100 100.0% 0 180 1,956
Qwen: Qwen3.5-122B-A10B 100 100 100.0% 0 264 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں