#37

Qwen3.6 27B

Qwen 发布日期: 2026-04-20 测试于: 2026-04-27 21:31 qwen/qwen3.6-27b::medium

(medium) (none)

摘要

Qwen3.6 27B 在 AI BENCHY 上得分 7.9，排名 #37。它的可靠性为 10.0，通过率为 77.8%，总成本为 $0.043，平均响应时间为 25.56s。

Qwen3.6 27B 的独特之处：在这个得分水平下，它的 benchmark 总成本异常低。

7.9

一致性

8.5

10.0

$0.043

总输出令牌

21,553

总输入令牌

输入价格

$0.500 / 1M

输出价格

$2.000 / 1M

错误测试数: 2

尝试通过率: 77.8%

不稳定测试

不稳定测试在运行之间出现混合结果（至少一次通过且至少一次失败）。

25.56s

响应时间（最大）: 47.48s

响应时间（总计）: 153.33s

无答案: 1 答案错误: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

测试历史

轮次对比

测试轮次	分数	一致性	可靠性	测试正确	不稳定测试	总输出令牌	总输入令牌	总成本	响应时间（平均）
2026-04-27 21:31 · 首次记录的运行	7.9	8.5	10.0	4/6	1	21,553	0	$0.043	25.56s
2026-06-04 13:21 · 新增测试	6.8	8.2	10.0	10/21	5	138,710	39,376	$0.444	59.71s
差值	+1.1	+0.3	0.0	-6	-4	-117157	-39376	-$0.401	-34159ms