AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY カテゴリ別失敗

雑学: 不正解

雑学
不正解

雑学 で 不正解 が起きやすいAIモデルを確認し、弱点を早く見つけられます。

表示モデル数

15

総失敗数

133

最も影響を受けたモデル

Qwen3.7 Max 1
133/133
順位 モデル 企業 不正解 件数 カテゴリスコア 合計コスト 正解テスト 応答時間(平均)

不正解 件数 上位モデル

不正解 件数 対 スコア

応答時間(平均) 上位モデル

推定無駄コスト 上位モデル