نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Qwen: Qwen3.5 Plus 2026-02-15

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-29

میٹرک Claude Opus 4.8 Claude Opus 4.8 none اجرا: 2026-05-28 Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium اجرا: 2026-02-15
اسکور 7.3 8.1
درجہ #65 #23
اعتماد پذیری 10.0 10.0
تسلسل 9.2 8.8
درست ٹیسٹس
فی کوشش کامیابی کی شرح 65.0% 76.7%
غیر مستحکم ٹیسٹ 2 3
کل رنز 60 60
فی نتیجہ لاگت 4.324 2.251
کل لاگت $0.519 $0.316
ان پٹ قیمت $5.000 / 1M $0.260 / 1M
آؤٹ پٹ قیمت $25.000 / 1M $1.560 / 1M
آؤٹ پٹ ٹوکنز 8,098 2,145
ریزننگ ٹوکنز 0 172,563
ردِعمل کا وقت (اوسط) 3.51s 67.58s
ردِعمل کا وقت (زیادہ سے زیادہ) 17.73s 266.69s
ردِعمل کا وقت (کل) 70.19s 878.57s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
Qwen3.5 Plus 2026-02-15 8.2 7.9 83.3% 1 45.78s 205 21,236
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
Qwen3.5 Plus 2026-02-15 7.6 6.7 66.7% 1 193.80s 406 63,554
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.85s 421 7,906
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.91s 270 14,916
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 17.50s 35 16,680
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
Qwen3.5 Plus 2026-02-15 4.7 1.6 66.7% 1 79.86s 73 8,675
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 31.93s 101 7,704
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 32.50s 301 13,853
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 7.54s 309 909
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 103.81s 24 17,130

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں