#69
DeepSeek
प्रकाशन: 2025-12-01
चाचणी तारीख: 2026-04-20 17:48
deepseek/deepseek-v3.2::none
(medium)
(none)
इनपुट किंमत
$0.252 / 1M
आउटपुट किंमत
$0.378 / 1M
अस्थिर चाचण्या
4
अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).
रन इतिहास
| चाचणी तारीख | स्कोअर | विश्वसनीयता | बरोबर चाचण्या | एकूण खर्च | तुलना करा |
|---|---|---|---|---|---|
| 2026-05-22 00:35 सूट बदलला | 5.6 | 10.0 | $0.018 | तुलना करा | |
| 2026-05-08 15:31 सूट बदलला | 5.7 | 10.0 | $0.016 | तुलना करा | |
| 2026-04-20 17:48 पहिली नोंदलेली रन | 6.1 | लागू नाही | $0.016 | सध्याची रन |
रन तुलना
| रन | स्कोअर | सुसंगतता | विश्वसनीयता | बरोबर चाचण्या | अस्थिर चाचण्या | एकूण आउटपुट टोकन्स | एकूण खर्च | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-20 17:48 · पहिली नोंदलेली रन | 6.1 | 8.1 | लागू नाही | 7/18 | 4 | 8,384 | $0.016 | 12.09s |
| 2026-05-08 15:31 · सूट बदलला | 5.7 | 7.9 | 10.0 | 7/19 | 5 | 7,194 | $0.016 | 13.43s |
| फरक | +0.5 | +0.2 | 0 | -1 | +1190 | +$0.001 | -1340ms |
या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.
चार्ट्स
पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.
स्कोअर vs एकूण खर्च
प्रतिसाद वेळ (सरासरी)
स्कोअर vs प्रतिसाद वेळ (सरासरी)
एकूण आउटपुट टोकन्स
स्कोअर vs एकूण आउटपुट टोकन्स
झटपट तुलना
DeepSeek V3.2nonevsMiMo-V2-OmnimediumDeepSeek V3.2nonevsGemma 4 31Bnoneमोफत उपलब्धDeepSeek V3.2nonevsGrok 4.20mediumDeepSeek V3.2nonevsGemini 3.1 Flash LiteminimalDeepSeek V3.2nonevsDeepSeek V4 ProhighDeepSeek V3.2nonevsKimi K2.5mediumDeepSeek V3.2nonevsGemini 3 Flash PreviewmediumDeepSeek V3.2nonevsGemini 3.5 FlashhighDeepSeek V3.2nonevsRing-2.6-1TmediumDeepSeek V3.2nonevsGemini 3.5 Flashlow
श्रेणीवार तपशील
| श्रेणी | स्कोअर | सुसंगतता | बरोबर चाचण्या |
|---|---|---|---|
| अँटी-एआय युक्त्या | 3.2 | 9.8 | |
| कोडिंग | 2.4 | 1.3 | |
| संयुक्त | 6.5 | 10.0 | |
| डेटा पार्सिंग आणि निष्कर्षण | 6.3 | 5.8 | |
| डोमेन-विशिष्ट | 3.6 | 7.2 | |
| Samanya Buddhimatta | 10.0 | 10.0 | |
| सूचनांचे पालन | 10.0 | 10.0 | |
| कोडी सोडवणे | 8.5 | 7.5 | |
| टूल कॉलिंग | 10.0 | 10.0 |