导航
AI BENCHY
Your ad here

AI BENCHY 对比

ByteDance Seed: Seed-2.0-Lite vs Google: Gemma 4 26B A4B

基准结果生成自 AI BENCHY 测试套件,时间:: 2026-04-16

指标 Seed-2.0-Lite Seed-2.0-Lite medium 发布日期: 2026-02-14 Gemma 4 26B A4B Gemma 4 26B A4B medium 发布日期: 2026-04-03 免费可用
分数 8.6 8.0
排名 #6 #24
一致性 8.8 9.0
测试正确
尝试通过率 83.3% 75.9%
不稳定测试 3 2
总运行次数 54 54
每个结果成本 0.926 0.214
总成本 $0.121 $0.028
???? $0.250 / 1M $0.070 / 1M
???? $2.000 / 1M $0.400 / 1M
输出令牌 3,257 15,928
推理令牌 52,042 44,631
响应时间(平均) 30.37s 25.03s
响应时间(最大) 168.71s 147.47s
响应时间(总计) 546.72s 425.48s

按分数排名的模型

分数 vs 总成本

响应时间(平均)

分数 vs 响应时间(平均)

总输出令牌

分数 vs 总输出令牌

类别细分

反AI技巧 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输出令牌 推理令牌
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 996 7,142
Gemma 4 26B A4B 10.0 10.0 100.0% 0 6.20s 1,142 3,045
编程 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输出令牌 推理令牌
Seed-2.0-Lite 10.0 10.0 100.0% 0 74.49s 436 7,319
Gemma 4 26B A4B 2.8 10.0 0.0% 0 147.47s 3,516 4,676
综合 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输出令牌 推理令牌
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
Gemma 4 26B A4B 9.6 10.0 100.0% 0 73.55s 5,415 13,112
数据解析与提取 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输出令牌 推理令牌
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 246 1,742
Gemma 4 26B A4B 10.0 10.0 100.0% 0 16.51s 1,567 2,827
领域专项 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输出令牌 推理令牌
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 15 23,897
Gemma 4 26B A4B 2.9 4.4 22.2% 2 23.62s 2,469 7,105
通用智能 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输出令牌 推理令牌
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 304 1,620
Gemma 4 26B A4B 10.0 10.0 100.0% 0 29.76s 25 5,075
指令遵循 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输出令牌 推理令牌
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
Gemma 4 26B A4B 10.0 10.0 100.0% 0 17.54s 887 4,470
谜题求解 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输出令牌 推理令牌
Seed-2.0-Lite 9.0 7.9 88.9% 1 11.03s 461 3,532
Gemma 4 26B A4B 7.9 9.6 66.7% 0 8.52s 457 3,065
工具调用 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输出令牌 推理令牌
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011
Gemma 4 26B A4B 10.0 10.0 100.0% 0 9.01s 450 1,256

快速对比

切换对比组合