AI BENCHY 失敗分析
タイムアウト の失敗
どのAIモデルで タイムアウト が起きやすいかを確認し、選ぶ前に信頼性のリスクを見極められます。 並び替え: スコア ↑.
| 順位 | モデル | 企業 | タイムアウト 件数 | スコア | 正解テスト | 応答時間(平均) |
|---|---|---|---|---|---|---|
| #23 | GLM 5 Turbo medium | Z.ai | 1 | 8.0 | 14/21 | 23.0s |
| #18 | Qwen3.7 Plus medium | Qwen | 1 | 8.2 | 15/21 | 38.9s |
| #17 | GLM 5 medium | Z.ai | 1 | 8.3 | 15/21 | 33.5s |
| #11 | Claude Opus 4.7 medium | Anthropic | 1 | 8.7 | 17/21 | 4.73s |