نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Anthropic: Claude Sonnet 4.6

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-01

میٹرک Claude Opus 4.6 Claude Opus 4.6 medium اجرا: 2026-02-05 Claude Sonnet 4.6 Claude Sonnet 4.6 none اجرا: 2026-02-17
اسکور 7.6 7.4
درجہ #50 #56
اعتماد پذیری دستیاب نہیں دستیاب نہیں
تسلسل 9.1 9.6
درست ٹیسٹس
فی کوشش کامیابی کی شرح 70.4% 64.8%
غیر مستحکم ٹیسٹ 2 1
کل رنز 54 54
فی نتیجہ لاگت 12.047 2.376
کل لاگت $1.446 $0.262
?? ?? ???? $5.000 / 1M $3.000 / 1M
??? ?? ???? $25.000 / 1M $15.000 / 1M
آؤٹ پٹ ٹوکنز 29,829 7,433
ریزننگ ٹوکنز 18,938 0
ردِعمل کا وقت (اوسط) 21.08s 4.98s
ردِعمل کا وقت (زیادہ سے زیادہ) 83.40s 23.84s
ردِعمل کا وقت (کل) 231.84s 54.83s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 1,214 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.67s 523 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 3,766 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 252 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 413 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 192 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 90 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.92s 536 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں