نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Qwen: Qwen3.5 Plus 2026-02-15

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-28

میٹرک Claude Opus 4.8 Claude Opus 4.8 medium اجرا: 2026-05-28 Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium اجرا: 2026-02-15
اسکور 8.7 8.1
درجہ #12 #22
اعتماد پذیری 10.0 10.0
تسلسل 9.6 8.8
درست ٹیسٹس
فی کوشش کامیابی کی شرح 83.3% 76.7%
غیر مستحکم ٹیسٹ 1 3
کل رنز 60 60
فی نتیجہ لاگت 6.285 2.251
کل لاگت $1.006 $0.283
ان پٹ قیمت $5.000 / 1M $0.260 / 1M
آؤٹ پٹ قیمت $25.000 / 1M $1.560 / 1M
آؤٹ پٹ ٹوکنز 23,201 2,145
ریزننگ ٹوکنز 5,901 172,563
ردِعمل کا وقت (اوسط) 9.34s 67.58s
ردِعمل کا وقت (زیادہ سے زیادہ) 38.03s 266.69s
ردِعمل کا وقت (کل) 186.84s 878.57s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 1,179 478
Qwen3.5 Plus 2026-02-15 8.2 7.9 83.3% 1 45.78s 205 21,236
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 14.97s 6,651 1,381
Qwen3.5 Plus 2026-02-15 7.6 6.7 66.7% 1 193.80s 406 63,554
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 5,260 1,588
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.85s 421 7,906
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 481 312
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.91s 270 14,916
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 7,477 900
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 17.50s 35 16,680
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 237 0
Qwen3.5 Plus 2026-02-15 4.7 1.6 66.7% 1 79.86s 73 8,675
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 373 320
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 31.93s 101 7,704
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 791 483
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 32.50s 301 13,853
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 301 225
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 7.54s 309 909
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 451 214
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 103.81s 24 17,130

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں