已对比模型

Gemma 4 31B (medium) vs Gemma 4 26B A4B (medium) vs Gemini 3 PRO Preview (medium) 基准对比Gemma 4 26B A4B (medium) 在分数上以 6.6 领先。 Gemma 4 31B (medium) 在可靠性上以 10.0 领先。 Gemma 4 26B A4B (medium) 的总成本最低，为 $0.089。 Gemini 3 PRO Preview (medium) 最快，为 9.05s。

推荐模型Gemma 4 26B A4B (medium)它在这里得分最高（6.6），同时成本比本次比较中的其他模型低约 3.1 倍。

基准结果生成自 AI BENCHY 测试套件，时间：: 2026-07-20

指标	Gemma 4 31B Gemma 4 31B medium 发布日期: 2026-04-02 免费可用	Gemma 4 26B A4B Gemma 4 26B A4B medium 发布日期: 2026-04-03 免费可用	Gemini 3 PRO Preview Gemini 3 PRO Preview medium 发布日期: 2025-11-18

指标	Gemma 4 31B Gemma 4 31B medium 发布日期: 2026-04-02 免费可用	Gemma 4 26B A4B Gemma 4 26B A4B medium 发布日期: 2026-04-03 免费可用	Gemini 3 PRO Preview Gemini 3 PRO Preview medium 发布日期: 2025-11-18
分数	6.3	6.6	6.0
排名	#110	#95	#133
可靠性	10.0	9.4	不适用
一致性	9.0	9.2	9.5
测试正确
尝试通过率	68.2%	66.7%	63.6%
不稳定测试	2	2	0
总运行次数	66	66	63
每个结果成本	1.044	0.643	1.406
总成本	$0.163	$0.089	$0.385
输入价格	$0.220 / 1M	$0.070 / 1M	$9.506 / 1M
输出价格	$0.550 / 1M	$0.340 / 1M	$9.506 / 1M
总输入令牌	94,992	77,550	28,848
输出令牌	34,468	28,036	1,490
推理令牌	223,278	219,491	10,102
响应时间（平均）	75.38s	103.83s	9.05s
响应时间（最大）	437.40s	912.19s	26.24s
响应时间（总计）	1507.52s	2180.47s	90.53s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#110 Gemma 4 31B

medium

成本: $0.002
时间: 45.7s
令牌: 2,696 tok

#95 Gemma 4 26B A4B

medium

无效SVG

成本: $0.000
时间: 300.0s
令牌: 0 tok

#133 Gemini 3 PRO Preview

medium

No endpoints found for google/gemini-3-pro-preview.

成本: $0.000
时间: 0.1s
令牌: 0 tok

按分数排名的模型

分数 vs 总成本

响应时间（平均）

分数 vs 响应时间（平均）

总输出令牌

分数 vs 总输出令牌

类别细分

类别:

反AI技巧	分数	一致性	尝试通过率	响应时间（平均）	输入令牌	输出令牌	推理令牌
Gemma 4 31B	10.0	10.0	100.0%	12.89s	816	962	2,046
Gemma 4 26B A4B	10.0	10.0	100.0%	6.20s	816	1,142	3,045
Gemini 3 PRO Preview	10.0	10.0	100.0%	14.99s	500	149	1,485

编程	分数	一致性	尝试通过率	不稳定测试	响应时间（平均）	输入令牌	输出令牌	推理令牌
Gemma 4 31B	4.3	5.8	22.2%	1	219.76s	5,568	11,098	33,212
Gemma 4 26B A4B	2.9	10.0	0.0%	0	272.54s	5,062	14,838	44,567
Gemini 3 PRO Preview	3.0	10.0	0.0%	0	0ms	0	0	0

综合	分数	一致性	尝试通过率	不稳定测试	响应时间（平均）	输入令牌	输出令牌	推理令牌
Gemma 4 31B	2.9	5.8	16.7%	1	433.11s	77,035	12,112	157,552
Gemma 4 26B A4B	6.3	10.0	50.0%	0	492.87s	54,390	5,451	132,113
Gemini 3 PRO Preview	1.5	5.0	0.0%	0	10.37s	13,211	351	952

数据解析与提取	分数	一致性	尝试通过率	响应时间（平均）	输入令牌	输出令牌	推理令牌
Gemma 4 31B	10.0	10.0	100.0%	21.11s	8,334	1,822	2,951
Gemma 4 26B A4B	10.0	10.0	100.0%	16.51s	8,334	1,567	2,827
Gemini 3 PRO Preview	10.0	10.0	100.0%	10.84s	7,259	279	3,156

领域专项	分数	一致性	尝试通过率	不稳定测试	响应时间（平均）	输入令牌	输出令牌	推理令牌
Gemma 4 31B	7.7	10.0	66.7%	0	38.48s	876	4,349	8,985
Gemma 4 26B A4B	2.9	4.4	22.2%	2	23.62s	516	2,469	7,105
Gemini 3 PRO Preview	5.3	10.0	33.3%	0	7.01s	643	15	1,195

通用智能	分数	一致性	尝试通过率	响应时间（平均）	输入令牌	输出令牌	推理令牌
Gemma 4 31B	10.0	10.0	100.0%	9.57s	567	105	888
Gemma 4 26B A4B	10.0	10.0	100.0%	29.76s	567	25	5,075
Gemini 3 PRO Preview	10.0	10.0	100.0%	9.34s	486	78	374

指令遵循	分数	一致性	尝试通过率	响应时间（平均）	输入令牌	输出令牌	推理令牌
Gemma 4 31B	10.0	10.0	100.0%	12.76s	777	533	2,035
Gemma 4 26B A4B	10.0	10.0	100.0%	17.54s	777	887	4,470
Gemini 3 PRO Preview	9.8	10.0	100.0%	3.26s	623	69	754

谜题求解	分数	一致性	尝试通过率	响应时间（平均）	输入令牌	输出令牌	推理令牌
Gemma 4 31B	9.9	10.0	100.0%	26.91s	801	1,795	5,595
Gemma 4 26B A4B	10.0	10.0	100.0%	5.79s	801	410	2,128
Gemini 3 PRO Preview	10.0	10.0	100.0%	3.88s	570	225	1,215

工具调用	分数	一致性	尝试通过率	响应时间（平均）	输入令牌	输出令牌	推理令牌
Gemma 4 31B	3.0	10.0	0.0%	0ms	0	0	0
Gemma 4 26B A4B	10.0	10.0	100.0%	9.01s	6,096	450	1,256
Gemini 3 PRO Preview	10.0	10.0	100.0%	11.96s	5,556	324	971

常识问答	分数	一致性	尝试通过率	响应时间（平均）	输入令牌	输出令牌	推理令牌
Gemma 4 31B	3.0	10.0	0.0%	90.14s	218	1,692	10,014
Gemma 4 26B A4B	3.0	10.0	0.0%	180.87s	191	797	16,905
Gemini 3 PRO Preview	3.0	10.0	0.0%	0ms	0	0	0

快速对比

切换对比组合

Gemma 4 26B A4Bmedium免费可用vsGLM 5.2none Gemma 4 26B A4Bmedium免费可用vsLongCat 2.0high Gemma 4 31Bmedium免费可用vsLongCat 2.0none Claude Sonnet 5nonevsGemma 4 31Bmedium免费可用 Gemma 4 26B A4Bmedium免费可用vsQwen3.6 Max Previewnone Gemma 4 26B A4Bmedium免费可用vsKAT-Coder-Pro V2.5none Gemma 4 26B A4Bmedium免费可用vsLongCat 2.0low Seed-2.0-LitenonevsGemma 4 31Bmedium免费可用 Gemma 4 31Bmedium免费可用vsGPT-5.6 Lunalow Gemma 4 26B A4Bmedium免费可用vsQwen3.5-27Bnone Gemma 4 31Bmedium免费可用vsQwen3.5 Plus 2026-02-15none Gemma 4 26B A4Bmedium免费可用vsQwen3.5 Plus 2026-02-15none