AI BENCHY カテゴリ別失敗
データ解析と抽出: 回答なし
データ解析と抽出
回答なし
データ解析と抽出 で 回答なし が起きやすいAIモデルを確認し、弱点を早く見つけられます。 並び替え: 失敗数 ↑.
| 順位 | モデル | 企業 | 回答なし 件数 | カテゴリスコア | 正解テスト | 応答時間(平均) |
|---|---|---|---|---|---|---|
| #17 | GLM 5 medium | Z.ai | 1 | 7.1 | 1/2 | 8.90s |
| #107 | Laguna Xs.2 medium | Poolside | 1 | 7.1 | 1/2 | 9.34s |
| #158 | GLM 4.7 Flash medium | Z.ai | 1 | 6.3 | 1/2 | 1.51s |
| #78 | Qwen3.6 27B medium | Qwen | 2 | 3.5 | 0/2 | 37.3s |