AI BENCHY
Advertise here
#103

DeepSeek V4 Pro

DeepSeek प्रकाशन: 2026-04-24 चाचणी तारीख: 2026-06-04 14:38 deepseek/deepseek-v4-pro::high
(high) (none)

सारांश

DeepSeek V4 Pro AI BENCHY वर 6.0 स्कोर करते आणि #103 वर आहे. याची reliability 9.0, pass rate 52.4%, एकूण खर्च $0.079, आणि सरासरी response time 65.21s आहे.

DeepSeek V4 Pro खास का आहे: हे संयुक्त मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर कोडिंग हा सर्वात कमकुवत भाग आहे, rank #11. हे असामान्यपणे जास्त reasoning tokens वापरते, ज्यामुळे runs हळू किंवा महाग होऊ शकतात.

सुसंगतता

7.6

एकूण खर्च (सध्याची किंमत)

$0.079 ↓ -65.9%

या किमतीवर चाचणी केली: $0.230

एकूण आउटपुट टोकन्स

84,507

एकूण इनपुट टोकन्स

32,240

इनपुट किंमत

$0.435 / 1M

आउटपुट किंमत

$0.870 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 13

प्रति प्रयत्न पास दर: 52.4%

अस्थिर चाचण्या

6

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

65.21s

प्रतिसाद वेळ (कमाल): 358.35s

प्रतिसाद वेळ (एकूण): 1304.19s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#103 DeepSeek V4 Pro

high
Cost
$0.023
Time
257.6s
Tokens
14,870 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 14:38 नवीन चाचणी जोडली 6.0 8.9 $0.079 सध्याची रन
2026-05-22 00:54 सूट बदलला 6.6 9.0 $0.212 तुलना करा
2026-04-29 14:47 पुन्हा चाचणी 7.5 9.3 $0.209 तुलना करा
2026-04-26 10:50 पुन्हा चाचणी 7.5 8.4 $0.201 तुलना करा
2026-04-25 21:53 पहिला रन 8.2 लागू नाही $0.329 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.435 / 1M $0.870 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 6.4 7.9
कोडिंग 3.3 6.4
संयुक्त 10.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 7.3 5.9
डोमेन-विशिष्ट 2.9 7.2
Samanya Buddhimatta 6.1 3.1
सूचनांचे पालन 10.0 10.0
कोडी सोडवणे 5.9 7.2
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स