AI BENCHY
比較する チャート
❤️ Made by XCS
Your ad here

#12

DeepSeek V3.2

Deepseek · リリース: 2025-12-01 · deepseek/deepseek-v3.2::medium

平均スコア

6.99

結果あたりのコスト

0.193

一貫性

8.75

合計コスト

$0.018

正解テスト

9

テストは、その全実行が合格した場合にのみ完全合格とみなされます。

誤答テスト数

5

試行ごとの合格率: 71.4%

不安定なテスト

2

応答時間: 平均 36.24s · 合計 507.30s · 最大 79.03s

不正解: 3 指示に従っていない: 1 タイムアウト: 1

スコア上位モデル

最初のモデルを選択し、次に2つ目のモデルをクリックして並列比較ページを開きます。

クイック比較

カテゴリ内訳

カテゴリ 平均スコア 一貫性 正解テスト
Anti-AI Tricks 7.00 9.86 2/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 4.00 7.21 1/3
Instructions following 7.00 9.84 1/2
Puzzle Solving 7.00 7.21 2/3
Tool Calling 10.00 10.00 1/1