AI BENCHY
比較する チャート 方法論
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY カテゴリ別失敗

ドメイン特化
余分な書式

ドメイン特化 で 余分な書式 が起きやすいAIモデルを確認し、弱点を早く見つけられます。 並び替え: 正解テスト ↑.

表示モデル数

2

総失敗数

3

最も影響を受けたモデル

Claude Sonnet 4.6 1

余分な書式 件数 上位モデル

余分な書式 件数 vs 平均スコア

応答時間(平均) 上位モデル

推定無駄コスト 上位モデル