नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs DeepSeek: DeepSeek V4 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 medium रिलीज़: 2026-05-28 DeepSeek V4 Flash DeepSeek V4 Flash high रिलीज़: 2026-04-24 निःशुल्क उपलब्ध
स्कोर 8.7 7.6
रैंक #12 #45
विश्वसनीयता 10.0 10.0
संगति 9.6 8.4
सही परीक्षण
प्रति प्रयास पास दर 83.3% 73.3%
अस्थिर टेस्ट 1 4
कुल रन 60 60
प्रति परिणाम लागत 6.285 0.309
कुल लागत $1.006 $0.028
इनपुट कीमत $5.000 / 1M $0.100 / 1M
आउटपुट कीमत $25.000 / 1M $0.200 / 1M
आउटपुट टोकन 23,201 10,302
रीजनिंग टोकन 5,901 115,740
प्रतिक्रिया समय (औसत) 9.34s 46.36s
प्रतिक्रिया समय (अधिकतम) 38.03s 218.13s
प्रतिक्रिया समय (कुल) 186.84s 927.27s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 1,179 478
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 140 7,770
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 14.97s 6,651 1,381
DeepSeek V4 Flash 6.8 10.0 50.0% 0 58.13s 387 27,101
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 5,260 1,588
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 465 7,347
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 481 312
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 201 1,179
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 7,477 900
DeepSeek V4 Flash 4.1 4.4 44.5% 2 100.31s 27 59,249
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 237 0
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 79 632
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 373 320
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 63 1,622
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 791 483
DeepSeek V4 Flash 8.2 7.2 88.9% 1 26.11s 196 1,767
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 301 225
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 228 542
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 451 214
DeepSeek V4 Flash 3.0 10.0 0.0% 0 54.46s 8,516 8,531

त्वरित तुलना

तुलना जोड़ी बदलें