AI BENCHY カテゴリ別失敗
指示追従: タイムアウト
指示追従
タイムアウト
指示追従 で タイムアウト が起きやすいAIモデルを確認し、弱点を早く見つけられます。 並び替え: 失敗数 ↑.
失敗理由
| 順位 | モデル | 企業 | タイムアウト 件数 | カテゴリスコア | 正解テスト | 応答時間(平均) |
|---|---|---|---|---|---|---|
| #97 | Qwen3.5-9B medium | Qwen | 1 | 6.4 | 1/2 | 17.1s |
AI BENCHY カテゴリ別失敗
指示追従 で タイムアウト が起きやすいAIモデルを確認し、弱点を早く見つけられます。 並び替え: 失敗数 ↑.
失敗理由
| 順位 | モデル | 企業 | タイムアウト 件数 | カテゴリスコア | 正解テスト | 応答時間(平均) |
|---|---|---|---|---|---|---|
| #97 | Qwen3.5-9B medium | Qwen | 1 | 6.4 | 1/2 | 17.1s |