AI BENCHY カテゴリ別失敗
パズル解決
余分な書式
パズル解決
余分な書式
パズル解決 で 余分な書式 が起きやすいAIモデルを確認し、弱点を早く見つけられます。
関連する失敗理由
| 順位 | モデル | 企業 | 余分な書式 件数 | カテゴリスコア | 正解テスト | 応答時間(平均) |
|---|---|---|---|---|---|---|
| #25 | Claude Sonnet 4.6 none | Anthropic | 1 | 7.0 | 2/3 | 2.92s |