#68

DeepSeek V3.2

DeepSeek रिलीज़: 2025-12-01 परीक्षण किया गया: 2026-06-04 14:41 deepseek/deepseek-v3.2::medium

(medium) (none)

सारांश

DeepSeek V3.2 AI BENCHY पर 7.5 स्कोर करता है और #68 पर है। इसकी reliability 10.0, pass rate 65.1%, कुल लागत $0.052, और औसत response time 68.71s है।

स्कोर

7.5

संगति

7.6

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.052 ↑ +6.9%

परीक्षण के समय: $0.048

कुल आउटपुट टोकन

106,267

कुल इनपुट टोकन

38,333

इनपुट कीमत

$0.269 / 1M

आउटपुट कीमत

$0.400 / 1M

सही परीक्षण

गलत टेस्ट: 10

प्रति प्रयास पास दर: 65.1%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

68.71s

प्रतिक्रिया समय (अधिकतम): 376.10s

प्रतिक्रिया समय (कुल): 1442.81s

गलत उत्तर: 5 API त्रुटि: 2 समय समाप्त: 2 निर्देशों का पालन नहीं किया: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#68 DeepSeek V3.2

medium

लागत: $0.001
समय: 53.6s
टोकन: 1,932 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-06-04 14:41 नया टेस्ट जोड़ा गया	7.0	10.0	$0.044 ↓	वर्तमान रन
2026-05-22 00:46 सूट बदला गया	7.0	9.1	$0.037	तुलना करें
2026-05-08 15:27 सूट बदला गया	7.2	10.0	$0.031	तुलना करें
2026-04-20 17:48 पहला दर्ज रन	8.0	लागू नहीं	$0.029	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल इनपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-06-04 14:41 · वर्तमान रन	7.5	7.6	10.0	11/21	6	106,267	38,333	$0.052	68.71s
2026-04-20 17:48 · पहला दर्ज रन	8.0	8.2	लागू नहीं	12/18	4	59,131	0	$0.029	46.41s
अंतर	-0.5	-0.6		-1	+2	+47136	+38333	+$0.023	+22298ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.229 / 1M	$0.344 / 1M
2026-07-10 11:30	$0.215 / 1M	$0.322 / 1M
2026-07-16 15:36	$0.269 / 1M	$0.400 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

DeepSeek V3.2mediumvsGPT-5.4 Nanomedium DeepSeek V3.2mediumvsGPT-5.3 Chatnone DeepSeek V3.2mediumvsKAT-Coder-Pro V2.5medium DeepSeek V3.2mediumvsSeed-2.0-Minimedium DeepSeek V3.2mediumvsGemini 3.5 Flashhigh DeepSeek V3.2mediumvsGemini 3 Flash Previewmedium DeepSeek V3.2mediumvsNemotron 3 Ultra 550b A55bmediumनिःशुल्क उपलब्ध DeepSeek V3.2mediumvsGPT-5.5low

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	8.2	7.9
कोडिंग	6.0	7.2
संयुक्त	10.0	10.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	2.9	4.4
Samanya Buddhimatta	3.4	2.5
निर्देश पालन	10.0	10.0
पहेली समाधान	7.0	7.2
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

DeepSeek V3.2

Hamster playing table tennis

#68 DeepSeek V3.2

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल