指令遵循 x 无答案排名

看看哪些 AI 模型在指令遵循上最容易遇到无答案，更快找出薄弱点。

显示的模型数

失败总数

受影响最多的模型

失败原因

答案错误61 未遵循指令18 额外格式3 无答案2 API 错误1 超时1

分类

综合29 编程18 常识问答13 数据解析与提取8 领域专项8 反AI技巧4 谜题求解3 工具调用2 指令遵循2

2/2

排名	模型	公司	无答案次数	分类得分	总成本	测试正确	响应时间（平均）
#143	Gemini 3.1 Flash Lite high	Google	1	7.3	$2.044	1/2	23.3s
总测试数 2 错误测试数 1 总成本 $2.044 响应时间（平均） 23.3s
#204	Qwen3.5-9B medium	Qwen	1	6.5	$0.036	1/2	5.75s
总测试数 2 错误测试数 1 总成本 $0.036 响应时间（平均） 5.75s

筛选模型