AI BENCHY
Your ad here

AI BENCHY カテゴリ別失敗

コーディング: 指示に従っていない

コーディング
指示に従っていない

コーディング で 指示に従っていない が起きやすいAIモデルを確認し、弱点を早く見つけられます。 並び替え: 応答時間(平均) ↓.

表示モデル数

2

総失敗数

2

最も影響を受けたモデル

Qwen3.5-9B 1

指示に従っていない 件数 上位モデル

指示に従っていない 件数 対 スコア

応答時間(平均) 上位モデル

推定無駄コスト 上位モデル