#50

DeepSeek V4 Pro

DeepSeek प्रकाशन: 2026-04-24 चाचणी तारीख: 2026-07-16 23:19 deepseek/deepseek-v4-pro::high

(high) (none)

सारांश

DeepSeek V4 Pro AI BENCHY वर 7.7 स्कोर करते आणि #50 वर आहे. याची reliability 10.0, pass rate 63.6%, एकूण खर्च $0.200, आणि सरासरी response time 79.14s आहे.

स्कोअर

7.7

सुसंगतता

7.7

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.200

एकूण आउटपुट टोकन्स

189,181

एकूण इनपुट टोकन्स

90,748

इनपुट किंमत

$0.435 / 1M

आउटपुट किंमत

$0.870 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 12

प्रति प्रयत्न पास दर: 63.6%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

79.14s

प्रतिसाद वेळ (कमाल): 416.76s

प्रतिसाद वेळ (एकूण): 1740.97s

चुकीचे उत्तर: 6 सूचनांचे पालन केले नाही: 2 API त्रुटी: 1 अतिरिक्त फॉरमॅटिंग: 1 उत्तर नाही: 1 वेळ संपला: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#50 DeepSeek V4 Pro

high

खर्च: $0.023
वेळ: 257.6s
टोकन्स: 14,870 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-07-16 23:19 नवीन चाचणी जोडली	7.7	10.0	$0.200	सध्याची रन
2026-06-16 15:31 पुन्हा चाचणी	7.6	9.3	$0.157	तुलना करा
2026-06-16 14:47 सूट बदलला	8.1	9.6	$0.098	तुलना करा
2026-06-04 14:38 नवीन चाचणी जोडली	6.0	8.9	$0.079 ↓	तुलना करा
2026-05-22 00:54 सूट बदलला	6.6	9.0	$0.212	तुलना करा
2026-04-29 14:47 पुन्हा चाचणी	7.5	9.3	$0.209	तुलना करा
2026-04-26 10:50 पुन्हा चाचणी	7.5	8.4	$0.201	तुलना करा
2026-04-25 21:53 पहिला रन	8.2	लागू नाही	$0.329	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण इनपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-07-16 23:19 · सध्याची रन	7.7	7.7	10.0	10/22	6	189,181	90,748	$0.200	79.14s
2026-04-29 14:47 · पुन्हा चाचणी	7.5	8.0	9.3	11/18	4	62,125	0	$0.209	60.03s
फरक	+0.1	-0.3	+0.7	-1	+2	+127056	+90748	-$0.009	+19101ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख	इनपुट किंमत	आउटपुट किंमत
2026-06-16 14:59	$0.435 / 1M	$0.870 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

DeepSeek V4 ProhighvsDeepSeek V4 Flashhigh DeepSeek V4 ProhighvsMiniMax M3medium DeepSeek V4 ProhighvsGPT-5.6 Lunahigh DeepSeek V4 ProhighvsGrok Build 0.1medium DeepSeek V4 ProhighvsClaude Opus 4.6medium DeepSeek V4 ProhighvsGPT-5.6 Lunamedium DeepSeek V4 ProhighvsGLM 5medium DeepSeek V4 ProhighvsNemotron 3 Ultramediumमोफत उपलब्ध DeepSeek V4 ProhighvsClaude Opus 4.8low DeepSeek V4 ProhighvsKimi K2.7 Codemedium

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	5.7	5.9
कोडिंग	6.3	8.7
संयुक्त	10.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	3.6	7.2
Samanya Buddhimatta	10.0	10.0
सूचनांचे पालन	7.8	6.6
कोडी सोडवणे	6.9	4.9
टूल कॉलिंग	9.8	10.0
सामान्य ज्ञान	3.0	10.0

DeepSeek V4 Pro

Hamster playing table tennis

#50 DeepSeek V4 Pro

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स