#73
分数
6.5…
一致性
10.0…
可靠性
不适用该模型的可靠性遥测不可用。
总成本
$0.007…
总输出令牌
868…
????
$0.400 / 1M…
$2.000 / 1M…
测试正确
8/18 只有当某个测试的所有运行都通过时,才计为完全通过。 答案错误: 8 未遵循指令: 2 响应时间(平均)1.99s 响应时间(最大)6.81s 响应时间(总计)35.81s …
错误测试数: 10
尝试通过率: 44.4%
不稳定测试
0…
不稳定测试在运行之间出现混合结果(至少一次通过且至少一次失败)。
响应时间(平均)
1.99s…
响应时间(最大): 6.81s
响应时间(总计): 35.81s
先选择第一个模型,再点击第二个模型打开并排页面。