AI BENCHY
Advertise here

AI BENCHY 失敗分析

余分な書式 の失敗

どのAIモデルで 余分な書式 が起きやすいかを確認し、選ぶ前に信頼性のリスクを見極められます。 並び替え: 合計コスト ↓.

表示モデル数

15

総失敗数

53

最も影響を受けたモデル

Grok 4.20 Multi Agent Beta 2
32/32
順位 モデル 企業 余分な書式 件数 スコア 合計コスト 正解テスト 応答時間(平均)

余分な書式 件数 上位モデル

余分な書式 件数 対 スコア

応答時間(平均) 上位モデル