#157

DeepSeek V3.2

DeepSeek रिलीज़: 2025-12-01 परीक्षण किया गया: 2026-06-04 14:22 deepseek/deepseek-v3.2::none

(medium) (none)

सारांश

DeepSeek V3.2 AI BENCHY पर 5.3 स्कोर करता है और #157 पर है। इसकी reliability 10.0, pass rate 39.7%, कुल लागत $0.020, और औसत response time 13.83s है।

DeepSeek V3.2 को अलग क्या बनाता है: यह संयुक्त में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि कोडिंग इसकी सबसे कमजोर जगह है, जहाँ यह #15 पर है।

स्कोर

5.3

संगति

7.6

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.020 ↑ +6.6%

परीक्षण के समय: $0.019

कुल आउटपुट टोकन

11,165

कुल इनपुट टोकन

55,997

इनपुट कीमत

$0.269 / 1M

आउटपुट कीमत

$0.400 / 1M

सही परीक्षण

गलत टेस्ट: 15

प्रति प्रयास पास दर: 39.7%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

13.83s

प्रतिक्रिया समय (अधिकतम): 115.89s

प्रतिक्रिया समय (कुल): 290.43s

गलत उत्तर: 7 API त्रुटि: 4 अतिरिक्त फॉर्मेटिंग: 2 निर्देशों का पालन नहीं किया: 1 अमान्य टूल कॉल: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#157 DeepSeek V3.2

none

लागत: $0.002
समय: 7.0s
टोकन: 1,046 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-06-04 14:22 नया टेस्ट जोड़ा गया	5.2	10.0	$0.017 ↓	वर्तमान रन
2026-05-22 00:35 सूट बदला गया	5.6	10.0	$0.018	तुलना करें
2026-05-08 15:31 सूट बदला गया	5.7	10.0	$0.016	तुलना करें
2026-04-20 17:48 पहला दर्ज रन	6.1	लागू नहीं	$0.016	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.229 / 1M	$0.344 / 1M
2026-07-10 11:30	$0.215 / 1M	$0.322 / 1M
2026-07-16 15:36	$0.269 / 1M	$0.400 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

DeepSeek V3.2nonevsNorth Mini Codemediumनिःशुल्क उपलब्ध DeepSeek V3.2nonevsQwen3.5 Plus 2026-02-15none DeepSeek V3.2nonevsKimi K2.6noneनिःशुल्क उपलब्ध DeepSeek V3.2nonevsGemini 3.5 Flashhigh DeepSeek V3.2nonevsGemini 3 Flash Previewmedium DeepSeek V3.2nonevsNemotron 3 Ultra 550b A55bmediumनिःशुल्क उपलब्ध DeepSeek V3.2nonevsGPT-5.5low

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	3.2	8.0
कोडिंग	3.1	6.9
संयुक्त	6.5	10.0
डेटा पार्सिंग और निष्कर्षण	6.3	5.8
डोमेन-विशिष्ट	2.9	7.2
Samanya Buddhimatta	4.7	1.6
निर्देश पालन	10.0	10.0
पहेली समाधान	7.6	7.2
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

DeepSeek V3.2

Hamster playing table tennis

#157 DeepSeek V3.2

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल