#73

DeepSeek V3.2

DeepSeek रिलीज़: 2025-12-01 परीक्षण किया गया: 2026-07-16 23:13 deepseek/deepseek-v3.2::medium

(medium) (none)

सारांश

DeepSeek V3.2 AI BENCHY पर 7.0 स्कोर करता है और #73 पर है। इसकी reliability 10.0, pass rate 65.2%, कुल लागत $0.078, और औसत response time 68.62s है।

DeepSeek V3.2 को अलग क्या बनाता है: इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है।

स्कोर

7.0

संगति

7.4

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.078 ↑ +4.5%

परीक्षण के समय: $0.074

कुल आउटपुट टोकन

128,848

कुल इनपुट टोकन

101,047

इनपुट कीमत

$0.269 / 1M

आउटपुट कीमत

$0.400 / 1M

सही परीक्षण

गलत टेस्ट: 11

प्रति प्रयास पास दर: 65.2%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

68.62s

प्रतिक्रिया समय (अधिकतम): 376.10s

प्रतिक्रिया समय (कुल): 1509.53s

गलत उत्तर: 5 API त्रुटि: 2 समय समाप्त: 2 निर्देशों का पालन नहीं किया: 1 अमान्य टूल कॉल: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#73 DeepSeek V3.2

medium

लागत: $0.001
समय: 53.6s
टोकन: 1,932 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 23:13 नया टेस्ट जोड़ा गया	7.0	10.0	$0.078 ↑	वर्तमान रन
2026-06-04 14:41 नया टेस्ट जोड़ा गया	7.0	10.0	$0.044 ↓	तुलना करें
2026-05-22 00:46 सूट बदला गया	7.0	9.1	$0.037	तुलना करें
2026-05-08 15:27 सूट बदला गया	7.2	10.0	$0.031	तुलना करें
2026-04-20 17:48 पहला दर्ज रन	8.0	लागू नहीं	$0.029	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल इनपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-07-16 23:13 · वर्तमान रन	7.0	7.4	10.0	11/22	7	128,848	101,047	$0.078	68.62s
2026-05-08 15:27 · सूट बदला गया	7.2	7.5	10.0	11/19	6	60,800	0	$0.031	46.06s
अंतर	-0.2	-0.1	0.0	0	+1	+68048	+101047	+$0.047	+22550ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.229 / 1M	$0.344 / 1M
2026-07-10 11:30	$0.215 / 1M	$0.322 / 1M
2026-07-16 15:36	$0.269 / 1M	$0.400 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

DeepSeek V3.2mediumvsGLM 5.1medium DeepSeek V3.2mediumvsGrok 4.3medium DeepSeek V3.2mediumvsKimi K2.5medium DeepSeek V3.2mediumvsQwen3.5-122B-A10Bmedium DeepSeek V3.2mediumvsMercury 2medium DeepSeek V3.2mediumvsGemini 3 Flash Previewmedium DeepSeek V3.2mediumvsGemini 3.5 Flashhigh DeepSeek V3.2mediumvsNemotron 3 Ultramediumनिःशुल्क उपलब्ध DeepSeek V3.2mediumvsGPT-5.5low

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	8.2	7.9
कोडिंग	6.0	7.2
संयुक्त	7.3	5.8
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	2.9	4.4
Samanya Buddhimatta	3.4	2.5
निर्देश पालन	10.0	10.0
पहेली समाधान	7.0	7.2
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

DeepSeek V3.2

Hamster playing table tennis

#73 DeepSeek V3.2

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल