AI BENCHY カテゴリ別失敗
反AIトリック: 不正解
反AIトリック
不正解
反AIトリック で 不正解 が起きやすいAIモデルを確認し、弱点を早く見つけられます。
| 順位 | モデル | 企業 | 不正解 件数 | カテゴリスコア | 正解テスト | 応答時間(平均) |
|---|---|---|---|---|---|---|
| #137 | Elephant Alpha none | Openrouter | 1 | 6.6 | 2/4 | 963ms |
| #138 | Ling-2.6-flash none | Inclusionai | 1 | 6.8 | 2/4 | 11.8s |
| #149 | Nemotron 3 Nano Omni 30b A3b Reasoning medium | NVIDIA | 1 | 6.4 | 2/4 | 1.20s |
| #156 | Hy3 preview none | Tencent | 1 | 4.8 | 1/4 | 11.1s |
| #161 | Qwen3.5-9B medium | Qwen | 1 | 5.1 | 1/4 | 34.4s |