AI BENCHY
Advertise here

AI BENCHY カテゴリ別失敗

コーディング: 不正解

コーディング
不正解

コーディング で 不正解 が起きやすいAIモデルを確認し、弱点を早く見つけられます。

表示モデル数

8

総失敗数

119

最も影響を受けたモデル

Qwen3.6 Flash 2
順位 モデル 企業 不正解 件数 カテゴリスコア 正解テスト 応答時間(平均)
#138 Qwen3.6 35B A3B none Qwen 1 6.8 1/2 12.3s
#140 Trinity Large Preview none Arcee AI 1 4.9 0/1 14.3s
#142 Qwen3 Coder Next medium Qwen 1 4.1 0/2 1.17s
#144 MiMo-V2-Flash none Xiaomi 1 4.9 0/2 2.04s
#147 Hy3 preview none Tencent 1 2.3 0/1 4.56s
#148 Ling-2.6-1T none Inclusionai 1 5.5 0/1 10.6s
#150 Grok 4.1 Fast none X AI 1 5.3 0/1 1.79s
#153 Granite 4.1 8B none IBM Granite 1 5.2 0/2 706ms

不正解 件数 上位モデル

不正解 件数 対 スコア

応答時間(平均) 上位モデル

推定無駄コスト 上位モデル