AI BENCHY
Your ad here

AI BENCHY カテゴリ別失敗

指示追従: API エラー

指示追従
API エラー

指示追従 で API エラー が起きやすいAIモデルを確認し、弱点を早く見つけられます。 並び替え: 正解テスト ↓.

表示モデル数

1

総失敗数

1

最も影響を受けたモデル

Grok 4.20 1

API エラー 件数 上位モデル

API エラー 件数 対 スコア

応答時間(平均) 上位モデル

推定無駄コスト 上位モデル