AI BENCHY
比較する チャート 方法論
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY カテゴリ別失敗

ツール呼び出し
回答なし

ツール呼び出し で 回答なし が起きやすいAIモデルを確認し、弱点を早く見つけられます。 並び替え: 応答時間(平均) ↓.

表示モデル数

2

総失敗数

2

最も影響を受けたモデル

Grok 4.1 Fast 1

関連する失敗理由

回答なし 件数 上位モデル

回答なし 件数 vs 平均スコア

応答時間(平均) 上位モデル

推定無駄コスト 上位モデル