#38

Claude Opus 4.8

Anthropic प्रकाशन: 2026-05-28 चाचणी तारीख: 2026-06-30 22:08 anthropic/claude-opus-4.8::low

(medium) (low) (none)

सारांश

Claude Opus 4.8 AI BENCHY वर 7.7 स्कोर करते आणि #38 वर आहे. याची reliability 10.0, pass rate 79.4%, एकूण खर्च $1.270, आणि सरासरी response time 10.83s आहे.

Claude Opus 4.8 खास का आहे: हे कोडी सोडवणे मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर डेटा पार्सिंग आणि निष्कर्षण हा सर्वात कमकुवत भाग आहे, rank #17.

स्कोअर

7.7

सुसंगतता

8.8

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$1.270

एकूण आउटपुट टोकन्स

38,602

एकूण इनपुट टोकन्स

60,946

इनपुट किंमत

$5.000 / 1M

आउटपुट किंमत

$25.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 6

प्रति प्रयत्न पास दर: 79.4%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

10.83s

प्रतिसाद वेळ (कमाल): 127.97s

प्रतिसाद वेळ (एकूण): 227.39s

चुकीचे उत्तर: 4 अतिरिक्त फॉरमॅटिंग: 1 उत्तर नाही: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#38 Claude Opus 4.8

low

खर्च: $0.031
वेळ: 14.1s
टोकन्स: 1,345 tok

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख	इनपुट किंमत	आउटपुट किंमत
2026-06-30 22:09	$5.000 / 1M	$25.000 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Claude Opus 4.8lowvsKimi K2.6mediumमोफत उपलब्ध Claude Opus 4.8lowvsGemini 3.1 Flash Litemedium Claude Opus 4.8lowvsGrok 4.3medium Claude Opus 4.8lowvsQwen3.5 Plus 2026-04-20medium Claude Opus 4.8lowvsClaude Opus 4.6medium Claude Opus 4.8lowvsGemini 3.5 Flashhigh Claude Opus 4.8lowvsGemini 3 Flash Previewmedium Claude Opus 4.8lowvsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध Claude Opus 4.8lowvsGPT-5.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	10.0	10.0
कोडिंग	6.6	4.6
संयुक्त	9.8	10.0
डेटा पार्सिंग आणि निष्कर्षण	6.3	5.8
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	10.0	10.0
सूचनांचे पालन	9.8	10.0
कोडी सोडवणे	10.0	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Claude Opus 4.8

Hamster playing table tennis

#38 Claude Opus 4.8

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स