نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Qwen: Qwen3.5-122B-A10B

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-28

میٹرک Claude Opus 4.8 Claude Opus 4.8 none اجرا: 2026-05-28 Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium اجرا: 2026-02-24
اسکور 7.3 7.7
درجہ #63 #41
اعتماد پذیری 10.0 10.0
تسلسل 9.2 8.8
درست ٹیسٹس
فی کوشش کامیابی کی شرح 65.0% 71.7%
غیر مستحکم ٹیسٹ 2 3
کل رنز 60 60
فی نتیجہ لاگت 4.324 5.031
کل لاگت $0.519 $0.509
ان پٹ قیمت $5.000 / 1M $0.260 / 1M
آؤٹ پٹ قیمت $25.000 / 1M $2.080 / 1M
آؤٹ پٹ ٹوکنز 8,098 26,166
ریزننگ ٹوکنز 0 213,524
ردِعمل کا وقت (اوسط) 3.51s 39.40s
ردِعمل کا وقت (زیادہ سے زیادہ) 17.73s 168.16s
ردِعمل کا وقت (کل) 70.19s 788.00s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.75s 269 16,835
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
Qwen3.5-122B-A10B 4.1 5.8 33.3% 1 119.57s 8,036 45,074
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 107.79s 483 11,337
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 23.41s 270 16,558
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
Qwen3.5-122B-A10B 2.9 7.2 11.1% 1 63.40s 15,537 64,889
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
Qwen3.5-122B-A10B 3.4 2.2 33.3% 1 34.11s 66 7,592
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.88s 77 7,372
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 17.89s 284 27,575
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 4.60s 322 1,226
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 52.87s 822 15,066

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں