#165

DeepSeek V3.2

DeepSeek प्रकाशन: 2025-12-01 चाचणी तारीख: 2026-07-16 23:15 deepseek/deepseek-v3.2::none

(medium) (none)

सारांश

DeepSeek V3.2 AI BENCHY वर 5.0 स्कोर करते आणि #165 वर आहे. याची reliability 10.0, pass rate 37.9%, एकूण खर्च $0.054, आणि सरासरी response time 18.25s आहे.

DeepSeek V3.2 खास का आहे: हे संयुक्त मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर कोडिंग हा सर्वात कमकुवत भाग आहे, rank #14.

स्कोअर

5.0

सुसंगतता

7.7

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.054 ↑ +2.3%

या किमतीवर चाचणी केली: $0.053

एकूण आउटपुट टोकन्स

42,097

एकूण इनपुट टोकन्स

135,780

इनपुट किंमत

$0.269 / 1M

आउटपुट किंमत

$0.400 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 16

प्रति प्रयत्न पास दर: 37.9%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

18.25s

प्रतिसाद वेळ (कमाल): 115.89s

प्रतिसाद वेळ (एकूण): 401.60s

चुकीचे उत्तर: 7 API त्रुटी: 4 अतिरिक्त फॉरमॅटिंग: 2 अवैध टूल कॉल: 2 सूचनांचे पालन केले नाही: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#165 DeepSeek V3.2

none

खर्च: $0.002
वेळ: 7.0s
टोकन्स: 1,046 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-07-16 23:15 नवीन चाचणी जोडली	5.0	10.0	$0.054 ↑	सध्याची रन
2026-06-04 14:22 नवीन चाचणी जोडली	5.2	10.0	$0.017 ↓	तुलना करा
2026-05-22 00:35 सूट बदलला	5.6	10.0	$0.018	तुलना करा
2026-05-08 15:31 सूट बदलला	5.7	10.0	$0.016	तुलना करा
2026-04-20 17:48 पहिली नोंदलेली रन	6.1	लागू नाही	$0.016	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण इनपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-07-16 23:15 · सध्याची रन	5.0	7.7	10.0	6/22	6	42,097	135,780	$0.054	18.25s
2026-04-20 17:48 · पहिली नोंदलेली रन	6.1	8.1	लागू नाही	7/18	4	8,384	0	$0.016	12.09s
फरक	-1.1	-0.4		-1	+2	+33713	+135780	+$0.038	+6168ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख	इनपुट किंमत	आउटपुट किंमत
2026-06-04 15:40	$0.229 / 1M	$0.344 / 1M
2026-07-10 11:30	$0.215 / 1M	$0.322 / 1M
2026-07-16 15:36	$0.269 / 1M	$0.400 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

DeepSeek V3.2nonevsQwen3.6 27Bnone DeepSeek V3.2nonevsMiMo-V2.5-Pronone DeepSeek V3.2nonevsGLM 5.1none DeepSeek V3.2nonevsKimi K2.5none DeepSeek V3.2nonevsDeepSeek V4 Flashnone DeepSeek V3.2nonevsGemma 4 26B A4Bnoneमोफत उपलब्ध DeepSeek V3.2nonevsGemini 3 Flash Previewmedium DeepSeek V3.2nonevsGemini 3.5 Flashhigh DeepSeek V3.2nonevsNemotron 3 Ultramediumमोफत उपलब्ध DeepSeek V3.2nonevsGPT-5.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	3.2	8.0
कोडिंग	3.1	6.9
संयुक्त	4.8	10.0
डेटा पार्सिंग आणि निष्कर्षण	6.3	5.8
डोमेन-विशिष्ट	2.9	7.2
Samanya Buddhimatta	4.7	1.6
सूचनांचे पालन	10.0	10.0
कोडी सोडवणे	7.6	7.2
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

DeepSeek V3.2

Hamster playing table tennis

#165 DeepSeek V3.2

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स