नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Opus 4.6 vs DeepSeek: DeepSeek V4 Pro

सारांश

Claude Opus 4.6 vs DeepSeek V4 Pro benchmark तुलना: Claude Opus 4.6 average score में आगे है: 7.7 vs 7.2. DeepSeek V4 Pro की benchmark लागत कम है: $0.034 vs $2.053. DeepSeek V4 Pro तेज है: 6.41s vs 25.89s, pass rates 61.9% vs 52.4%.

अनुशंसित मॉडल: DeepSeek V4 Pro - Its score stays close to the best score here (7.2 vs 7.7), while costing about 61.7x less than Claude Opus 4.6.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium रिलीज़: 2026-02-05 DeepSeek V4 Pro DeepSeek V4 Pro none रिलीज़: 2026-04-24
स्कोर 7.7 7.2
रैंक #38 #58
विश्वसनीयता 10.0 9.9
संगति 8.8 8.8
सही परीक्षण
प्रति प्रयास पास दर 61.9% 52.4%
अस्थिर टेस्ट 3 3
कुल रन 63 63
प्रति परिणाम लागत 17.103 0.333
कुल लागत $2.053 $0.034
इनपुट कीमत $5.000 / 1M $0.435 / 1M
आउटपुट कीमत $25.000 / 1M $0.870 / 1M
कुल इनपुट टोकन 53,227 53,558
आउटपुट टोकन 47,446 11,424
रीजनिंग टोकन 24,000 0
प्रतिक्रिया समय (औसत) 25.89s 6.41s
प्रतिक्रिया समय (अधिकतम) 83.40s 30.09s
प्रतिक्रिया समय (कुल) 362.49s 134.66s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#38 Claude Opus 4.6

medium
अमान्य SVG
लागत
$0.000
समय
300.0s
टोकन
0 tok

#58 DeepSeek V4 Pro

none
अमान्य SVG
लागत
$0.000
समय
300.0s
टोकन
0 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 840 986 1,071
DeepSeek V4 Pro 3.2 6.1 16.7% 2 4.02s 540 1,168 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 5.7 7.1 44.4% 1 30.10s 8,522 13,057 4,121
DeepSeek V4 Pro 5.6 10.0 33.3% 0 13.38s 7,275 5,500 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 20,685 8,178 5,194
DeepSeek V4 Pro 9.5 10.0 100.0% 0 23.74s 27,529 2,235 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 8,676 691 757
DeepSeek V4 Pro 10.0 10.0 100.0% 0 4.61s 7,568 200 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 674 14,642 8,687
DeepSeek V4 Pro 5.3 10.0 33.3% 0 3.72s 666 24 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 564 188 292
DeepSeek V4 Pro 5.0 10.0 0.0% 0 2.05s 471 126 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 792 266 467
DeepSeek V4 Pro 6.3 5.8 66.7% 1 4.12s 627 713 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 7.7 10.0 66.7% 0 4.71s 816 532 630
DeepSeek V4 Pro 10.0 10.0 100.0% 0 3.61s 594 442 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 11,454 861 329
DeepSeek V4 Pro 10.0 10.0 100.0% 0 7.40s 8,105 328 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 63.24s 204 8,045 2,452
DeepSeek V4 Pro 3.0 10.0 0.0% 0 5.76s 183 688 0

त्वरित तुलना

तुलना जोड़ी बदलें