#108

Step 3.5 Flash

Stepfun 发布日期: 2026-02-01 测试于: 2026-04-11 01:44 stepfun/step-3.5-flash::none

(medium) (none)

摘要

Step 3.5 Flash 在 AI BENCHY 上得分 3.0，排名 #108。它的可靠性为 不适用，通过率为 0.0%，总成本为 $0.000，平均响应时间为 0ms。

Step 3.5 Flash 的独特之处：在这个得分水平下，它的 benchmark 总成本异常低。相比类似模型，它的速度明显更快。

已归档模型：该模型将不再更新，也不会在新测试中继续测试。

3.0

一致性

10.0

不适用

$0.000

总输出令牌

总输入令牌

输入价格

$0.100 / 1M

输出价格

$0.300 / 1M

错误测试数: 1

尝试通过率: 0.0%

不稳定测试

不稳定测试在运行之间出现混合结果（至少一次通过且至少一次失败）。

0ms

响应时间（最大）: 0ms

响应时间（总计）: 0ms

API 错误: 1

生成展示

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

测试历史

测试于	分数	可靠性	测试正确	总成本	比较
2026-05-08 15:30 新增测试	6.6	10.0		$0.020	比较
2026-04-11 01:44 首次记录的运行	3.0	不适用		$0.000	当前轮次

轮次对比

测试轮次	分数	一致性	可靠性	测试正确	总输出令牌	总输入令牌	总成本	响应时间（平均）
2026-04-11 01:44 · 首次记录的运行	3.0	10.0	不适用	0/1	0	0	$0.000	0ms
2026-05-08 15:30 · 新增测试	6.6	10.0	10.0	6/12	64,795	1,971	$0.020	39.03s
差值	-3.6	0.0		-6	-64795	-1971	-$0.020	-39032ms