नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs DeepSeek: DeepSeek V3.2

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-29

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 none प्रकाशन: 2026-05-28 DeepSeek V3.2 DeepSeek V3.2 medium प्रकाशन: 2025-12-01
स्कोअर 7.3 7.3
क्रमांक #65 #67
विश्वसनीयता 10.0 10.0
सुसंगतता 9.2 7.9
बरोबर चाचण्या
प्रति प्रयत्न पास दर 65.0% 67.5%
अस्थिर चाचण्या 2 5
एकूण रन 60 60
प्रति निकाल खर्च 4.324 0.335
एकूण खर्च $0.519 $0.037
इनपुट किंमत $5.000 / 1M $0.252 / 1M
आउटपुट किंमत $25.000 / 1M $0.378 / 1M
आउटपुट टोकन्स 8,098 7,177
रिझनिंग टोकन्स 0 68,297
प्रतिसाद वेळ (सरासरी) 3.51s 53.34s
प्रतिसाद वेळ (कमाल) 17.73s 189.03s
प्रतिसाद वेळ (एकूण) 70.19s 1066.71s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
DeepSeek V3.2 10.0 10.0 100.0% 0 24.23s 3,247 6,953
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
DeepSeek V3.2 4.1 5.8 33.3% 1 184.97s 640 21,230
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 571 6,296
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 207 7,693
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
DeepSeek V3.2 2.9 4.4 22.2% 2 24.27s 21 6,838
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
DeepSeek V3.2 5.1 2.5 50.0% 1 58.29s 49 2,189
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 1,397 2,845
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
DeepSeek V3.2 7.0 7.2 55.6% 1 37.69s 518 6,375
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 507 859
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
DeepSeek V3.2 3.0 10.0 0.0% 0 83.99s 20 7,019

झटपट तुलना

तुलना जोडी बदला