Claude Opus 4.7

Anthropic प्रकाशन: 2026-04-16 चाचणी तारीख: 2026-04-16 15:59 anthropic/claude-opus-4.7::medium

(medium) (none)

सारांश

Claude Opus 4.7 AI BENCHY वर 9.2 स्कोर करते आणि #3 वर आहे. याची reliability लागू नाही, pass rate 88.9%, एकूण खर्च $0.447, आणि सरासरी response time 3.53s आहे.

Claude Opus 4.7 खास का आहे: हे एकूणात सर्वाधिक rank असलेल्या मॉडेल्सपैकी एक आहे. या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे. समान मॉडेल्सच्या तुलनेत हे लक्षणीय वेगवान आहे.

स्कोअर

9.2

सुसंगतता

10.0

विश्वसनीयता

लागू नाही

एकूण खर्च (सध्याची किंमत)

$0.447

एकूण आउटपुट टोकन्स

6,716

एकूण इनपुट टोकन्स

इनपुट किंमत

$5.000 / 1M

आउटपुट किंमत

$25.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 2

प्रति प्रयत्न पास दर: 88.9%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

3.53s

प्रतिसाद वेळ (कमाल): 21.45s

प्रतिसाद वेळ (एकूण): 60.03s

वेळ संपला: 1 चुकीचे उत्तर: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#3 Claude Opus 4.7

medium

खर्च: $0.059
वेळ: 26.8s
टोकन्स: 2,475 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:44 नवीन चाचणी जोडली	8.7	10.0	$0.679	तुलना करा
2026-05-22 00:18 पुन्हा चाचणी	8.9	10.0	$0.625	तुलना करा
2026-04-16 15:59 पहिली नोंदलेली रन	9.2	लागू नाही	$0.447	सध्याची रन

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	एकूण आउटपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-04-16 15:59 · पहिली नोंदलेली रन	9.2	10.0	लागू नाही	16/18	6,716	$0.447	3.53s
2026-05-22 00:18 · पुन्हा चाचणी	8.9	10.0	10.0	17/20	12,666	$0.625	4.50s
फरक	+0.3	0.0		-1	-5950	-$0.179	-967ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Claude Opus 4.7mediumvsClaude Opus 4.8medium Claude Opus 4.7mediumvsGLM 5.2medium Claude Opus 4.7mediumvsQwen3.6 Max Previewmedium Claude Opus 4.7mediumvsGLM 5medium Claude Opus 4.7mediumvsGPT-5.3-Codexmedium Claude Opus 4.7mediumvsGPT-5 Minimedium Claude Opus 4.7mediumvsGemini 3.5 Flashhigh Claude Opus 4.7mediumvsGemini 3 Flash Previewmedium Claude Opus 4.7mediumvsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध Claude Opus 4.7mediumvsGPT-5.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	8.3	10.0
कोडिंग	10.0	10.0
संयुक्त	10.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	7.7	10.0
Samanya Buddhimatta	10.0	10.0
सूचनांचे पालन	10.0	10.0
कोडी सोडवणे	10.0	10.0
टूल कॉलिंग	10.0	10.0

Claude Opus 4.7

Hamster playing table tennis

#3 Claude Opus 4.7

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स