नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Sonnet 4.6 vs DeepSeek: DeepSeek V4 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-24

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 medium रिलीज़: 2026-02-17 DeepSeek V4 Flash DeepSeek V4 Flash high रिलीज़: 2026-04-24
स्कोर 8.0 7.8
रैंक #30 #35
संगति 9.5 7.8
सही परीक्षण
प्रति प्रयास पास दर 74.1% 79.6%
अस्थिर टेस्ट 1 5
कुल रन 54 52
प्रति परिणाम लागत 8.930 0.189
कुल लागत $1.161 $0.021
???? ??? $3.000 / 1M $0.140 / 1M
????? ??? $15.000 / 1M $0.280 / 1M
आउटपुट टोकन 42,068 1,757
रीजनिंग टोकन 26,784 55,907
प्रतिक्रिया समय (औसत) 12.66s 47.47s
प्रतिक्रिया समय (अधिकतम) 46.35s 255.28s
प्रतिक्रिया समय (कुल) 126.62s 854.45s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.5 10.0 50.0% 0 2.98s 1,046 1,093
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 140 7,770
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 35.76s 6,894 2,097
DeepSeek V4 Flash 10.0 10.0 100.0% 0 62.48s 369 9,361
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 46.35s 5,871 3,962
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 465 7,347
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 13.90s 649 742
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 201 1,179
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 2.9 7.2 11.1% 1 0ms 25,790 16,919
DeepSeek V4 Flash 4.1 4.4 44.5% 2 112.69s 19 24,857
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.94s 256 433
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 79 632
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 2.61s 318 552
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 63 1,622
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.80s 589 635
DeepSeek V4 Flash 6.4 4.5 77.8% 2 25.53s 193 2,597
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 7.48s 655 351
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 228 542

त्वरित तुलना

तुलना जोड़ी बदलें