ツール呼び出し x 回答なしランキング

ツール呼び出しで回答なしが起きやすいAIモデルを確認し、弱点を早く見つけられます。並び替え: 正解テスト ↓.

表示モデル数

総失敗数

最も影響を受けたモデル

失敗理由

API エラー17 無効なツール呼び出し9 指示に従っていない8 不正解3 回答なし2

カテゴリ

複合29 コーディング18 雑学13 データ解析と抽出8 ドメイン特化8 反AIトリック4 パズル解決3 ツール呼び出し2 指示追従2

2/2

順位	モデル	企業	回答なし件数	カテゴリスコア	合計コスト	正解テスト	応答時間（平均）
#21	GPT-5.2 medium	OpenAI	1	4.7	$0.951	0/1	10.3s
合計テスト数 1 誤答テスト数 1 合計コスト $0.951 応答時間（平均） 10.3s
#185	Grok 4.1 Fast medium	X AI	1	2.8	$0.069	0/1	27.7s
合計テスト数 1 誤答テスト数 1 合計コスト $0.069 応答時間（平均） 27.7s

モデルを絞り込む