AI BENCHY
Your ad here

AI BENCHY カテゴリ別失敗

ツール呼び出し: 不正解

ツール呼び出し
不正解

ツール呼び出し で 不正解 が起きやすいAIモデルを確認し、弱点を早く見つけられます。

表示モデル数

2

総失敗数

2

最も影響を受けたモデル

GLM 4.7 Flash 1

不正解 件数 上位モデル

不正解 件数 対 スコア

応答時間(平均) 上位モデル

推定無駄コスト 上位モデル