指令遵循 x 超时排名

看看哪些 AI 模型在指令遵循上最容易遇到超时，更快找出薄弱点。

显示的模型数

失败总数

受影响最多的模型

失败原因

答案错误61 未遵循指令18 额外格式3 无答案2 API 错误1 超时1

分类

领域专项43 编程26 综合5 谜题求解5 反AI技巧4 通用智能4 指令遵循1 数据解析与提取1

1/1

排名	模型	公司	超时次数	分类得分	总成本	测试正确	响应时间（平均）
#160	Laguna XS 2.1 none	Poolside	1	3.8	$0.008	0/2	364ms
总测试数 2 错误测试数 2 总成本 $0.008 响应时间（平均） 364ms

筛选模型