指令遵循 x API 错误排名

看看哪些 AI 模型在指令遵循上最容易遇到 API 错误，更快找出薄弱点。排序方式: 响应时间（平均） ↓.

显示的模型数

失败总数

受影响最多的模型

失败原因

答案错误61 未遵循指令18 额外格式3 无答案2 API 错误1 超时1

分类

编程45 综合26 工具调用17 反AI技巧14 数据解析与提取14 常识问答13 谜题求解12 通用智能12 领域专项7 指令遵循1

1/1

排名	模型	公司	API 错误次数	分类得分	总成本	测试正确	响应时间（平均）
#175	Qwen3.6 Plus Preview medium	Qwen	1	6.5	$0.000	1/2	3.40s
总测试数 2 错误测试数 1 总成本 $0.000 响应时间（平均） 3.40s

筛选模型