AI BENCHY カテゴリ別失敗
反AIトリック
余分な書式
反AIトリック
余分な書式
反AIトリック で 余分な書式 が起きやすいAIモデルを確認し、弱点を早く見つけられます。 並び替え: 正解テスト ↑.
関連する失敗理由
| 順位 | モデル | 企業 | 余分な書式 件数 | カテゴリスコア | 正解テスト | 応答時間(平均) |
|---|---|---|---|---|---|---|
| #33 | DeepSeek V3.2 none | DeepSeek | 2 | 10.0 | 0/3 | 8.79s |
| #48 | Qwen3 Coder Next none | Qwen | 1 | 2.3 | 0/3 | 4.39s |
| #25 | Claude Sonnet 4.6 none | Anthropic | 2 | 4.0 | 1/3 | 4.83s |
| #26 | Claude Opus 4.6 medium | Anthropic | 2 | 4.0 | 1/3 | 11.9s |
| #11 | Claude Sonnet 4.6 medium | Anthropic | 1 | 7.0 | 2/3 | 4.95s |