AI BENCHY カテゴリ別失敗
複合: 指示に従っていない
複合
指示に従っていない
複合 で 指示に従っていない が起きやすいAIモデルを確認し、弱点を早く見つけられます。 並び替え: 失敗数 ↑.
1/1
モデルを絞り込む
現在の検索条件とフィルターに一致するモデルはありません。
| 順位 | モデル | 企業 | 指示に従っていない 件数 | カテゴリスコア | 合計コスト | 正解テスト | 応答時間(平均) |
|---|---|---|---|---|---|---|---|
| #119 | MiMo-V2.5-Pro none | Xiaomi | 1 | 3.0 | $0.017 | 0/1 | 3.54s |