नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs DeepSeek: DeepSeek V4 Flash

सारांश

Claude Opus 4.6 vs DeepSeek V4 Flash benchmark तुलना: DeepSeek V4 Flash average score मध्ये पुढे आहे: 8.3 vs 7.7. DeepSeek V4 Flash चा benchmark खर्च कमी आहे: $0.029 vs $2.053. Claude Opus 4.6 वेगवान आहे: 25.89s vs 45.85s, pass rates 61.9% vs 74.6%.

शिफारस केलेले मॉडेल: DeepSeek V4 Flash - It has the best score here (8.3), while costing about 72.1x less than Claude Opus 4.6.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-12

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium प्रकाशन: 2026-02-05 DeepSeek V4 Flash DeepSeek V4 Flash high प्रकाशन: 2026-04-24
स्कोअर 7.7 8.3
क्रमांक #41 #26
विश्वसनीयता 10.0 10.0
सुसंगतता 8.8 8.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 61.9% 74.6%
अस्थिर चाचण्या 3 4
एकूण रन 63 63
प्रति निकाल खर्च 17.103 0.299
एकूण खर्च $2.053 $0.029
इनपुट किंमत $5.000 / 1M $0.098 / 1M
आउटपुट किंमत $25.000 / 1M $0.196 / 1M
एकूण इनपुट टोकन्स 53,227 39,745
आउटपुट टोकन्स 47,446 10,310
रिझनिंग टोकन्स 24,000 123,501
प्रतिसाद वेळ (सरासरी) 25.89s 45.85s
प्रतिसाद वेळ (कमाल) 83.40s 218.13s
प्रतिसाद वेळ (एकूण) 362.49s 962.79s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#41 Claude Opus 4.6

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

#26 DeepSeek V4 Flash

high
Cost
$0.003
Time
93.1s
Tokens
7,926 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 840 986 1,071
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 540 140 7,770
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 5.7 7.1 44.4% 1 30.10s 8,522 13,057 4,121
DeepSeek V4 Flash 7.8 10.0 66.7% 0 50.60s 7,279 395 34,862
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 20,685 8,178 5,194
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 14,016 465 7,347
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 8,676 691 757
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 7,290 201 1,179
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 674 14,642 8,687
DeepSeek V4 Flash 4.1 4.4 44.5% 2 100.31s 666 27 59,249
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 564 188 292
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 471 79 632
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 792 266 467
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 627 63 1,622
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 7.7 10.0 66.7% 0 4.71s 816 532 630
DeepSeek V4 Flash 8.2 7.2 88.9% 1 26.11s 594 196 1,767
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 11,454 861 329
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 8,079 228 542
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 3.0 10.0 0.0% 0 63.24s 204 8,045 2,452
DeepSeek V4 Flash 3.0 10.0 0.0% 0 54.46s 183 8,516 8,531

झटपट तुलना

तुलना जोडी बदला