#157

DeepSeek V3.2

DeepSeek रिलीज़: 2025-12-01 परीक्षण किया गया: 2026-06-04 14:22 deepseek/deepseek-v3.2::none

(medium) (none)

सारांश

DeepSeek V3.2 AI BENCHY पर 5.3 स्कोर करता है और #157 पर है। इसकी reliability 10.0, pass rate 39.7%, कुल लागत $0.020, और औसत response time 13.83s है।

DeepSeek V3.2 को अलग क्या बनाता है: यह संयुक्त में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि कोडिंग इसकी सबसे कमजोर जगह है, जहाँ यह #15 पर है।

स्कोर

5.3

संगति

7.6

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.020 ↑ +6.6%

परीक्षण के समय: $0.019

कुल आउटपुट टोकन

11,165

कुल इनपुट टोकन

55,997

इनपुट कीमत

$0.269 / 1M

आउटपुट कीमत

$0.400 / 1M

सही परीक्षण

गलत टेस्ट: 15

प्रति प्रयास पास दर: 39.7%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

13.83s

प्रतिक्रिया समय (अधिकतम): 115.89s

प्रतिक्रिया समय (कुल): 290.43s

गलत उत्तर: 7 API त्रुटि: 4 अतिरिक्त फॉर्मेटिंग: 2 निर्देशों का पालन नहीं किया: 1 अमान्य टूल कॉल: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#157 DeepSeek V3.2

none

लागत: $0.002
समय: 7.0s
टोकन: 1,046 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-06-04 14:22 नया टेस्ट जोड़ा गया	5.2	10.0	$0.017 ↓	वर्तमान रन
2026-05-22 00:35 सूट बदला गया	5.6	10.0	$0.018	तुलना करें
2026-05-08 15:31 सूट बदला गया	5.7	10.0	$0.016	तुलना करें
2026-04-20 17:48 पहला दर्ज रन	6.1	लागू नहीं	$0.016	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल इनपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-06-04 14:22 · वर्तमान रन	5.3	7.6	10.0	6/21	6	11,165	55,997	$0.020	13.83s
2026-05-08 15:31 · सूट बदला गया	5.7	7.9	10.0	7/19	5	7,194	0	$0.016	13.43s
अंतर	-0.4	-0.3	0.0	-1	+1	+3971	+55997	+$0.005	+404ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.229 / 1M	$0.344 / 1M
2026-07-10 11:30	$0.215 / 1M	$0.322 / 1M
2026-07-16 15:36	$0.269 / 1M	$0.400 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

DeepSeek V3.2nonevsNorth Mini Codemediumनिःशुल्क उपलब्ध DeepSeek V3.2nonevsQwen3.5 Plus 2026-02-15none DeepSeek V3.2nonevsKimi K2.6noneनिःशुल्क उपलब्ध DeepSeek V3.2nonevsGemini 3.5 Flashhigh DeepSeek V3.2nonevsGemini 3 Flash Previewmedium DeepSeek V3.2nonevsNemotron 3 Ultra 550b A55bmediumनिःशुल्क उपलब्ध DeepSeek V3.2nonevsGPT-5.5low

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	3.2	8.0
कोडिंग	3.1	6.9
संयुक्त	6.5	10.0
डेटा पार्सिंग और निष्कर्षण	6.3	5.8
डोमेन-विशिष्ट	2.9	7.2
Samanya Buddhimatta	4.7	1.6
निर्देश पालन	10.0	10.0
पहेली समाधान	7.6	7.2
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

DeepSeek V3.2

Hamster playing table tennis

#157 DeepSeek V3.2

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल