#24
分数
8.1…
一致性
8.3…
可靠性
10.0…
总成本
$0.180…
总输出令牌
91,351…
????
$0.600 / 1M…
$1.920 / 1M…
测试正确
13/19 只有当某个测试的所有运行都通过时,才计为完全通过。 答案错误: 3 未遵循指令: 1 无答案: 1 超时: 1 响应时间(平均)27.34s 响应时间(最大)79.09s 响应时间(总计)300.78s …
错误测试数: 6
尝试通过率: 80.7%
不稳定测试
4…
不稳定测试在运行之间出现混合结果(至少一次通过且至少一次失败)。
响应时间(平均)
27.34s…
响应时间(最大): 79.09s
响应时间(总计): 300.78s
先选择第一个模型,再点击第二个模型打开并排页面。