AI BENCHY
Advertise here

AI BENCHY 失敗分析

余分な書式 の失敗

どのAIモデルで 余分な書式 が起きやすいかを確認し、選ぶ前に信頼性のリスクを見極められます。 並び替え: 失敗数 ↑.

表示モデル数

15

総失敗数

53

最も影響を受けたモデル

Qwen3.5-27B 1
32/32
順位 モデル 企業 余分な書式 件数 スコア 合計コスト 正解テスト 応答時間(平均)

余分な書式 件数 上位モデル

余分な書式 件数 対 スコア

応答時間(平均) 上位モデル