#78
DeepSeek
प्रकाशन: 2026-04-24
चाचणी तारीख: 2026-04-29 14:46
deepseek/deepseek-v4-pro::none
(high)
(none)
इनपुट किंमत
$0.435 / 1M
आउटपुट किंमत
$0.870 / 1M
अस्थिर चाचण्या
3
अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).
रन इतिहास
| चाचणी तारीख | स्कोअर | विश्वसनीयता | बरोबर चाचण्या | एकूण खर्च | तुलना करा |
|---|---|---|---|---|---|
| 2026-05-22 00:38 सूट बदलला | 6.0 | 8.1 | $0.046 | तुलना करा | |
| 2026-04-29 14:46 पुन्हा चाचणी | 6.2 | 7.9 | $0.043 | सध्याची रन | |
| 2026-04-24 09:19 पहिला रन | 3.1 | लागू नाही | $0.009 | तुलना करा |
रन तुलना
| रन | स्कोअर | सुसंगतता | विश्वसनीयता | बरोबर चाचण्या | अस्थिर चाचण्या | एकूण आउटपुट टोकन्स | एकूण खर्च | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-29 14:46 · पुन्हा चाचणी | 6.2 | 8.7 | 7.9 | 7/18 | 3 | 3,903 | $0.043 | 14.01s |
| 2026-04-24 09:19 · पहिला रन | 3.1 | 7.2 | लागू नाही | 0/18 | 6 | 591 | $0.009 | 44.40s |
| फरक | +3.1 | +1.5 | +7 | -3 | +3312 | +$0.034 | -30391ms |
चार्ट्स
पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.
स्कोअर vs एकूण खर्च
प्रतिसाद वेळ (सरासरी)
स्कोअर vs प्रतिसाद वेळ (सरासरी)
एकूण आउटपुट टोकन्स
स्कोअर vs एकूण आउटपुट टोकन्स
झटपट तुलना
DeepSeek V4 PrononevsGemini 3.1 Flash LiteminimalDeepSeek V4 PrononevsMiMo-V2-OmnimediumDeepSeek V4 PrononevsKimi K2.5mediumDeepSeek V4 PrononevsGrok 4.20mediumDeepSeek V4 PrononevsGemini 3 Flash PreviewmediumDeepSeek V4 PrononevsGemini 3.5 FlashhighDeepSeek V4 PrononevsRing-2.6-1TmediumDeepSeek V4 PrononevsGemini 3.5 Flashlow
श्रेणीवार तपशील
| श्रेणी | स्कोअर | सुसंगतता | बरोबर चाचण्या |
|---|---|---|---|
| अँटी-एआय युक्त्या | 3.5 | 8.0 | |
| कोडिंग | 7.1 | 3.7 | |
| संयुक्त | 9.5 | 10.0 | |
| डेटा पार्सिंग आणि निष्कर्षण | 10.0 | 10.0 | |
| डोमेन-विशिष्ट | 5.3 | 10.0 | |
| Samanya Buddhimatta | 4.3 | 9.9 | |
| सूचनांचे पालन | 6.3 | 10.0 | |
| कोडी सोडवणे | 6.0 | 7.1 | |
| टूल कॉलिंग | 10.0 | 10.0 |