नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Opus 4.7 vs DeepSeek: DeepSeek V4 Pro

सारांश

Claude Opus 4.7 vs DeepSeek V4 Pro benchmark तुलना: Claude Opus 4.7 average score में आगे है: 8.7 vs 7.6. DeepSeek V4 Pro की benchmark लागत कम है: $0.157 vs $0.679. Claude Opus 4.7 तेज है: 4.73s vs 77.20s, pass rates 82.5% vs 66.7%.

अनुशंसित मॉडल: Claude Opus 4.7 - It has the best score here (8.7), while responding about 16.3x faster than DeepSeek V4 Pro.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-17

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 medium रिलीज़: 2026-04-16 DeepSeek V4 Pro DeepSeek V4 Pro high रिलीज़: 2026-04-24
स्कोर 8.7 7.6
रैंक #13 #41
विश्वसनीयता 10.0 9.3
संगति 9.6 7.0
सही परीक्षण
प्रति प्रयास पास दर 82.5% 66.7%
अस्थिर टेस्ट 1 8
कुल रन 63 63
प्रति परिणाम लागत 3.991 1.742
कुल लागत $0.679 $0.157
इनपुट कीमत $5.000 / 1M $0.435 / 1M
आउटपुट कीमत $25.000 / 1M $0.870 / 1M
कुल इनपुट टोकन 65,406 38,726
आउटपुट टोकन 11,858 6,334
रीजनिंग टोकन 2,198 159,151
प्रतिक्रिया समय (औसत) 4.73s 77.20s
प्रतिक्रिया समय (अधिकतम) 23.18s 416.76s
प्रतिक्रिया समय (कुल) 94.51s 1621.17s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#13 Claude Opus 4.7

medium
Cost
$0.059
Time
26.8s
Tokens
2,475 tok

#41 DeepSeek V4 Pro

high
Cost
$0.023
Time
257.6s
Tokens
14,870 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 894 348 0
DeepSeek V4 Pro 5.7 5.9 58.3% 2 25.70s 536 149 3,214
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 7.6 7.2 77.8% 1 12.96s 10,635 7,629 1,114
DeepSeek V4 Pro 6.1 4.6 66.7% 2 243.00s 5,090 383 84,580
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 24,501 2,369 1,084
DeepSeek V4 Pro 10.0 10.0 100.0% 0 38.17s 14,060 454 5,836
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 10,533 324 0
DeepSeek V4 Pro 10.0 10.0 100.0% 0 25.03s 7,690 274 2,166
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 630 51 0
DeepSeek V4 Pro 3.6 7.2 22.2% 1 151.46s 569 4,404 50,391
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 723 256 0
DeepSeek V4 Pro 10.0 10.0 100.0% 0 8.83s 471 115 1,013
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 939 114 0
DeepSeek V4 Pro 7.8 6.6 83.3% 1 8.73s 627 66 2,726
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.43s 939 370 0
DeepSeek V4 Pro 6.9 4.9 77.8% 2 56.85s 591 178 2,563
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 15,339 373 0
DeepSeek V4 Pro 9.8 10.0 100.0% 0 15.92s 8,909 295 701
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 3.0 10.0 0.0% 0 2.25s 273 24 0
DeepSeek V4 Pro 3.0 10.0 0.0% 0 34.01s 183 16 5,961

त्वरित तुलना

तुलना जोड़ी बदलें