نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs Inception: Mercury 2

موازنہ کریں:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-05

میٹرک Anthropic: Claude Sonnet 4.6 none اجرا: 2026-02-17 Inception: Mercury 2 medium اجرا: 2026-02-24
درجہ #25 #35
اوسط اسکور 6.9 5.4
درست ٹیسٹس
تسلسل 10.0 8.3
فی نتیجہ لاگت 2.460 0.622
کل لاگت $0.246 $0.044
فی کوشش کامیابی کی شرح 66.7% 57.8%
غیر مستحکم ٹیسٹ 0 3
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
آؤٹ پٹ ٹوکنز 6,703 3,571
ریزننگ ٹوکنز 0 45,379
ردِعمل کا وقت (اوسط) 5.94s 2.47s
ردِعمل کا وقت (زیادہ سے زیادہ) 23.84s 14.63s
ردِعمل کا وقت (کل) 47.55s 34.56s

اسکور کے لحاظ سے سرفہرست ماڈلز

ردِعمل کا وقت (اوسط)

اسکور بمقابلہ کل لاگت

اوسط اسکور vs ردِعمل کا وقت (اوسط)

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 4.0 10.0 33.3% 0 4.83s 1,199 0
Inception: Mercury 2 7.3 9.8 66.7% 0 1.30s 2,531 2,410
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 9.0 10.0 100.0% 0 23.84s 3,766 0
Inception: Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 9.9 10.0 100.0% 0 3.43s 252 0
Inception: Mercury 2 5.5 5.9 83.3% 1 1.11s 183 1,656
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 7.0 10.0 66.7% 0 3.54s 413 0
Inception: Mercury 2 10.0 7.2 11.1% 1 6.48s 41 30,754
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 5.5 10.0 50.0% 0 1.96s 90 0
Inception: Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 7.0 10.0 66.7% 0 2.92s 536 0
Inception: Mercury 2 1.7 7.5 22.2% 1 934ms 354 2,758
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0
Inception: Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں