नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs Anthropic: Claude Sonnet 4.6

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 none रिलीज़: 2026-05-28 Claude Sonnet 4.6 Claude Sonnet 4.6 medium रिलीज़: 2026-02-17
स्कोर 7.3 7.6
रैंक #63 #51
विश्वसनीयता 10.0 10.0
संगति 9.2 9.2
सही परीक्षण
प्रति प्रयास पास दर 65.0% 68.3%
अस्थिर टेस्ट 2 2
कुल रन 60 60
प्रति परिणाम लागत 4.324 10.229
कुल लागत $0.519 $1.330
इनपुट कीमत $5.000 / 1M $3.000 / 1M
आउटपुट कीमत $25.000 / 1M $15.000 / 1M
आउटपुट टोकन 8,098 49,891
रीजनिंग टोकन 0 29,565
प्रतिक्रिया समय (औसत) 3.51s 15.81s
प्रतिक्रिया समय (अधिकतम) 17.73s 46.35s
प्रतिक्रिया समय (कुल) 70.19s 189.71s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
Claude Sonnet 4.6 6.5 10.0 50.0% 0 2.98s 1,046 1,093
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
Claude Sonnet 4.6 6.9 6.0 66.7% 1 33.87s 11,277 3,281
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
Claude Sonnet 4.6 10.0 10.0 100.0% 0 46.35s 5,871 3,962
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
Claude Sonnet 4.6 10.0 10.0 100.0% 0 13.90s 649 742
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
Claude Sonnet 4.6 2.9 7.2 11.1% 1 0ms 25,790 16,919
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.94s 256 433
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
Claude Sonnet 4.6 10.0 10.0 100.0% 0 2.61s 318 552
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
Claude Sonnet 4.6 10.0 10.0 100.0% 0 5.31s 592 646
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
Claude Sonnet 4.6 10.0 10.0 100.0% 0 7.48s 655 351
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
Claude Sonnet 4.6 3.0 10.0 0.0% 0 30.09s 3,437 1,586

त्वरित तुलना

तुलना जोड़ी बदलें