#25

Claude Sonnet 4.6

Anthropic · रिलीज़: 2026-02-17 · anthropic/claude-sonnet-4.6::medium

स्कोर

7.9

संगति

9.5

कुल लागत

$1.024

कुल आउटपुट टोकन

59,861

???? ???

$3.000 / 1M

????? ???

$15.000 / 1M

सही परीक्षण

गलत टेस्ट: 5

प्रति प्रयास पास दर: 72.6%

अस्थिर टेस्ट

1

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

10.09s

प्रतिक्रिया समय (अधिकतम): 46.35s

प्रतिक्रिया समय (कुल): 90.85s

अतिरिक्त फॉर्मेटिंग: 2 गलत उत्तर: 2 समय समाप्त: 1

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Claude Sonnet 4.6mediumvsQwen3.5-Flashmedium Claude Sonnet 4.6mediumvsGemini 3 Flash Previewnone Claude Sonnet 4.6mediumvsMiMo-V2-Omnimedium Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewlow Claude Sonnet 4.6mediumvsGrok 4.20 Betamedium Claude Sonnet 4.6mediumvsGemini 3 Flash Previewmedium Claude Sonnet 4.6mediumvsGemini 3.1 Pro Previewmedium Claude Sonnet 4.6mediumvsQwen3.6 Plus Previewmedium

श्रेणी विवरण

श्रेणी	स्कोर	संगति	सही परीक्षण
एंटी-एआई ट्रिक्स	6.5	10.0
संयुक्त	10.0	10.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	2.9	7.2
Samanya Buddhimatta	10.0	10.0
निर्देश पालन	10.0	10.0
पहेली समाधान	10.0	10.0
टूल कॉलिंग	10.0	10.0

तुलना किए गए मॉडल