#12
DeepSeek V3.2
Deepseek · اجرا: 2025-12-01 · deepseek/deepseek-v3.2::medium
اوسط اسکور
6.99
فی نتیجہ لاگت
0.193
تسلسل
8.75
کل لاگت
$0.018
درست ٹیسٹس
9
کوئی ٹیسٹ تبھی مکمل کامیاب شمار ہوگا جب اس کے تمام رنز کامیاب ہوں
غلط ٹیسٹس
5
فی کوشش کامیابی کی شرح: 71.4%
غیر مستحکم ٹیسٹ
2
ردِعمل کا وقت: اوسط 36.24s · کل 507.30s · زیادہ سے زیادہ 79.03s
غلط جواب: 3
ہدایات پر عمل نہیں کیا: 1
ٹائم آؤٹ: 1
اسکور کے لحاظ سے سرفہرست ماڈلز
پہلا ماڈل منتخب کریں، پھر دوسرا ماڈل کلک کریں تاکہ سائیڈ بائی سائیڈ صفحہ کھلے۔
فوری موازنہ
DeepSeek V3.2mediumvsStep 3.5 Flashmediumمفت دستیابDeepSeek V3.2mediumvsGPT-5.2mediumDeepSeek V3.2mediumvsGemini 3 Flash PreviewnoneDeepSeek V3.2mediumvsQwen3.5-122B-A10BmediumDeepSeek V3.2mediumvsGLM 5mediumDeepSeek V3.2mediumvsClaude Sonnet 4.6noneDeepSeek V3.2mediumvsGemini 3 Flash PreviewmediumDeepSeek V3.2mediumvsGemini 3.1 Pro Previewmedium
زمرہ وار تفصیل
| زمرہ | اوسط اسکور | تسلسل | درست ٹیسٹس |
|---|---|---|---|
| Anti-AI Tricks | 7.00 | 9.86 | 2/3 |
| Data parsing and extraction | 9.88 | 10.00 | 2/2 |
| Domain specific | 4.00 | 7.21 | 1/3 |
| Instructions following | 7.00 | 9.84 | 1/2 |
| Puzzle Solving | 7.00 | 7.21 | 2/3 |
| Tool Calling | 10.00 | 10.00 | 1/1 |