#12
DeepSeek V3.2
Deepseek · リリース: 2025-12-01 · deepseek/deepseek-v3.2::medium
平均スコア
6.99
結果あたりのコスト
0.193
一貫性
8.75
合計コスト
$0.018
正解テスト
9
テストは、その全実行が合格した場合にのみ完全合格とみなされます。
誤答テスト数
5
試行ごとの合格率: 71.4%
不安定なテスト
2
応答時間: 平均 36.24s · 合計 507.30s · 最大 79.03s
不正解: 3
指示に従っていない: 1
タイムアウト: 1
スコア上位モデル
最初のモデルを選択し、次に2つ目のモデルをクリックして並列比較ページを開きます。
クイック比較
DeepSeek V3.2mediumvsStep 3.5 Flashmedium無料で利用可能DeepSeek V3.2mediumvsGPT-5.2mediumDeepSeek V3.2mediumvsGemini 3 Flash PreviewnoneDeepSeek V3.2mediumvsQwen3.5-122B-A10BmediumDeepSeek V3.2mediumvsGLM 5mediumDeepSeek V3.2mediumvsClaude Sonnet 4.6noneDeepSeek V3.2mediumvsGemini 3 Flash PreviewmediumDeepSeek V3.2mediumvsGemini 3.1 Pro Previewmedium
カテゴリ内訳
| カテゴリ | 平均スコア | 一貫性 | 正解テスト |
|---|---|---|---|
| Anti-AI Tricks | 7.00 | 9.86 | 2/3 |
| Data parsing and extraction | 9.88 | 10.00 | 2/2 |
| Domain specific | 4.00 | 7.21 | 1/3 |
| Instructions following | 7.00 | 9.84 | 1/2 |
| Puzzle Solving | 7.00 | 7.21 | 2/3 |
| Tool Calling | 10.00 | 10.00 | 1/1 |