AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY カテゴリ別失敗

複合: API エラー

複合
API エラー

複合 で API エラー が起きやすいAIモデルを確認し、弱点を早く見つけられます。

表示モデル数

5

総失敗数

5

最も影響を受けたモデル

Gemma 4 31B 1
順位 モデル 企業 API エラー 件数 カテゴリスコア 正解テスト 応答時間(平均)
#14 Gemma 4 31B medium Google 1 3.0 0/1 0ms
#48 Gemma 4 31B none Google 1 3.0 0/1 0ms
#56 Grok 4.20 Multi Agent Beta medium X AI 1 3.0 0/1 0ms
#84 gpt-oss-120b none OpenAI 1 3.0 0/1 0ms
#98 LFM2-24B-A2B none Liquid 1 3.0 0/1 0ms

API エラー 件数 上位モデル

API エラー 件数 対 スコア

応答時間(平均) 上位モデル

推定無駄コスト 上位モデル