指示追従 x 回答なしランキング

指示追従で回答なしが起きやすいAIモデルを確認し、弱点を早く見つけられます。

表示モデル数

総失敗数

最も影響を受けたモデル

失敗理由

不正解61 指示に従っていない18 余分な書式3 回答なし2 API エラー1 タイムアウト1

カテゴリ

複合29 コーディング18 雑学13 データ解析と抽出8 ドメイン特化8 反AIトリック4 パズル解決3 ツール呼び出し2 指示追従2

2/2

順位	モデル	企業	回答なし件数	カテゴリスコア	合計コスト	正解テスト	応答時間（平均）
#143	Gemini 3.1 Flash Lite high	Google	1	7.3	$2.044	1/2	23.3s
合計テスト数 2 誤答テスト数 1 合計コスト $2.044 応答時間（平均） 23.3s
#204	Qwen3.5-9B medium	Qwen	1	6.5	$0.036	1/2	5.75s
合計テスト数 2 誤答テスト数 1 合計コスト $0.036 応答時間（平均） 5.75s

モデルを絞り込む