#12

DeepSeek V3.2

Deepseek · प्रकाशन: 2025-12-01 · deepseek/deepseek-v3.2::medium

सरासरी स्कोअर

6.99

प्रति निकाल खर्च

0.193

सुसंगतता

8.75

एकूण खर्च

$0.018

बरोबर चाचण्या

9

एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.

चुकीच्या चाचण्या

5

प्रति प्रयत्न पास दर: 71.4%

अस्थिर चाचण्या

2

प्रतिसाद वेळ: सरासरी 36.24s · एकूण 507.30s · कमाल 79.03s

चुकीचे उत्तर: 3 सूचनांचे पालन केले नाही: 1 वेळ संपला: 1

स्कोअरनुसार शीर्ष मॉडेल्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

#6 Gemini 3 Flash Preview 8.36

#7 GPT-5.3-Codex 7.93

#8 Claude Sonnet 4.6 7.43

#9 GLM 5 7.29

#10 Gemini 3 Flash Preview 7.22

#11 Step 3.5 Flash 7.00

#12 DeepSeek V3.2 6.99

#13 GPT-5.2 6.93

#14 Qwen3.5-122B-A10B 6.77

#15 Claude Sonnet 4.6 6.36

#16 Qwen3.5 Plus 2026-02-15 6.29

#17 Grok 4.1 Fast 6.29

#18 Kimi K2.5 6.29

श्रेणी	सरासरी स्कोअर	सुसंगतता	बरोबर चाचण्या
Anti-AI Tricks	7.00	9.86	2/3
Data parsing and extraction	9.88	10.00	2/2
Domain specific	4.00	7.21	1/3
Instructions following	7.00	9.84	1/2
Puzzle Solving	7.00	7.21	2/3
Tool Calling	10.00	10.00	1/1