नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Opus 4.7 vs Anthropic: Claude Opus 4.8

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-28

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 medium रिलीज़: 2026-04-16 Claude Opus 4.8 Claude Opus 4.8 medium रिलीज़: 2026-05-28
स्कोर 8.9 8.7
रैंक #7 #12
विश्वसनीयता 10.0 10.0
संगति 10.0 9.6
सही परीक्षण
प्रति प्रयास पास दर 85.0% 83.3%
अस्थिर टेस्ट 0 1
कुल रन 60 60
प्रति परिणाम लागत 3.670 6.285
कुल लागत $0.624 $1.006
इनपुट कीमत $5.000 / 1M $5.000 / 1M
आउटपुट कीमत $25.000 / 1M $25.000 / 1M
आउटपुट टोकन 10,439 23,201
रीजनिंग टोकन 2,198 5,901
प्रतिक्रिया समय (औसत) 4.48s 9.34s
प्रतिक्रिया समय (अधिकतम) 23.18s 38.03s
प्रतिक्रिया समय (कुल) 85.21s 186.84s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 348 0
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 1,179 478
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 14.79s 6,210 1,114
Claude Opus 4.8 10.0 10.0 100.0% 0 14.97s 6,651 1,381
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 2,369 1,084
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 5,260 1,588
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 324 0
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 481 312
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 51 0
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 7,477 900
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 256 0
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 237 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 114 0
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 373 320
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.43s 370 0
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 791 483
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 373 0
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 301 225
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 3.0 10.0 0.0% 0 2.25s 24 0
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 451 214

त्वरित तुलना

तुलना जोड़ी बदलें