AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY 失敗分析

余分な書式 の失敗

どのAIモデルで 余分な書式 が起きやすいかを確認し、選ぶ前に信頼性のリスクを見極められます。 並び替え: 合計コスト ↑.

表示モデル数

15

総失敗数

53

最も影響を受けたモデル

North Mini Code 2
32/32
順位 モデル 企業 余分な書式 件数 スコア 合計コスト 正解テスト 応答時間(平均)

余分な書式 件数 上位モデル

余分な書式 件数 対 スコア

応答時間(平均) 上位モデル