نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs Qwen: Qwen3.6 Flash

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-27

میٹرک Claude Opus 4.7 Claude Opus 4.7 medium اجرا: 2026-04-16 Qwen3.6 Flash Qwen3.6 Flash medium اجرا: 2026-04-20
اسکور 9.2 8.1
درجہ #3 #24
اعتماد پذیری دستیاب نہیں 10.0
تسلسل 10.0 8.2
درست ٹیسٹس
فی کوشش کامیابی کی شرح 88.9% 79.6%
غیر مستحکم ٹیسٹ 0 4
کل رنز 54 54
فی نتیجہ لاگت 2.790 1.449
کل لاگت $0.447 $0.174
?? ?? ???? $5.000 / 1M $0.250 / 1M
??? ?? ???? $25.000 / 1M $1.500 / 1M
آؤٹ پٹ ٹوکنز 5,375 2,804
ریزننگ ٹوکنز 1,341 107,210
ردِعمل کا وقت (اوسط) 3.53s 9.90s
ردِعمل کا وقت (زیادہ سے زیادہ) 21.45s 26.85s
ردِعمل کا وقت (کل) 60.03s 178.26s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 348 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.10s 624 14,024
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 6.41s 1,141 257
Qwen3.6 Flash 6.7 3.5 66.7% 1 25.84s 435 17,044
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 2,369 1,084
Qwen3.6 Flash 10.0 10.0 100.0% 0 20.28s 483 13,839
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 324 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 9.65s 270 13,155
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 51 0
Qwen3.6 Flash 3.5 4.4 33.3% 2 14.65s 60 24,409
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 256 0
Qwen3.6 Flash 4.8 9.9 0.0% 0 9.88s 140 5,445
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 114 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.05s 102 7,423
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 2.51s 399 0
Qwen3.6 Flash 8.2 7.2 88.9% 1 6.17s 355 10,683
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 373 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 4.00s 335 1,188

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں