AI BENCHY 对比

IBM: Granite 4.1 8B vs Nemotron 3 Nano Omni 30b A3b Reasoning

基准结果生成自 AI BENCHY 测试套件，时间：: 2026-05-01

指标	Granite 4.1 8B Granite 4.1 8B none 发布日期: 2026-05-01	Nemotron 3 Nano Omni 30b A3b Reasoning Nemotron 3 Nano Omni 30b A3b Reasoning medium 发布日期: 2026-04-28 免费可用

指标	Granite 4.1 8B Granite 4.1 8B none 发布日期: 2026-05-01	Nemotron 3 Nano Omni 30b A3b Reasoning Nemotron 3 Nano Omni 30b A3b Reasoning medium 发布日期: 2026-04-28 免费可用
分数	4.3	5.2
排名	#135	#114
可靠性	10.0	10.0
一致性	10.0	5.9
测试正确
尝试通过率	11.1%	47.9%
不稳定测试	0	8
总运行次数	54	54
每个结果成本	0.110	0.000
总成本	$0.003	$0.000
????	$0.050 / 1M	$0.000 / 1M
????	$0.100 / 1M	$0.000 / 1M
输出令牌	2,712	50,628
推理令牌	0	184,655
响应时间（平均）	767ms	14.46s
响应时间（最大）	2.17s	147.45s
响应时间（总计）	13.81s	231.37s

按分数排名的模型

分数 vs 总成本

响应时间（平均）

分数 vs 响应时间（平均）

总输出令牌

分数 vs 总输出令牌

类别细分

反AI技巧	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输出令牌	推理令牌
Granite 4.1 8B	4.9	10.0	25.0%	0		844ms	903	0
Nemotron 3 Nano Omni 30b A3b Reasoning	7.0	5.9	75.0%	2		2.17s	2,490	3,481

编程	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输出令牌	推理令牌
Granite 4.1 8B	6.9	10.0	0.0%	0		1.07s	339	0
Nemotron 3 Nano Omni 30b A3b Reasoning	3.3	1.7	33.3%	1		38.09s	6,097	30,508

综合	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输出令牌	推理令牌
Granite 4.1 8B	3.0	10.0	0.0%	0		1.88s	396	0
Nemotron 3 Nano Omni 30b A3b Reasoning	0.0	0.0	0.0%	0		0ms	0	0

数据解析与提取	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输出令牌	推理令牌
Granite 4.1 8B	3.0	10.0	0.0%	0		575ms	195	0
Nemotron 3 Nano Omni 30b A3b Reasoning	7.3	5.9	83.3%	1		2.72s	890	2,811

领域专项	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输出令牌	推理令牌
Granite 4.1 8B	3.0	10.0	0.0%	0		357ms	24	0
Nemotron 3 Nano Omni 30b A3b Reasoning	2.9	7.2	11.1%	1		56.67s	40,404	142,623

通用智能	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输出令牌	推理令牌
Granite 4.1 8B	4.0	10.0	0.0%	0		499ms	115	0
Nemotron 3 Nano Omni 30b A3b Reasoning	4.8	9.9	0.0%	0		1.43s	41	850

指令遵循	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输出令牌	推理令牌
Granite 4.1 8B	3.6	9.9	0.0%	0		344ms	66	0
Nemotron 3 Nano Omni 30b A3b Reasoning	7.1	6.6	66.7%	1		1.53s	192	1,728

谜题求解	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输出令牌	推理令牌
Granite 4.1 8B	3.7	10.0	0.0%	0		635ms	431	0
Nemotron 3 Nano Omni 30b A3b Reasoning	3.5	4.4	33.3%	2		1.56s	514	2,654

工具调用	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输出令牌	推理令牌
Granite 4.1 8B	10.0	10.0	100.0%	0		2.17s	243	0
Nemotron 3 Nano Omni 30b A3b Reasoning	0.0	0.0	0.0%	0		0ms	0	0

快速对比

切换对比组合

Mistral Small 4nonevsNemotron 3 Nano Omni 30b A3b Reasoningmedium免费可用 Trinity Large PreviewnonevsNemotron 3 Nano Omni 30b A3b Reasoningmedium免费可用 Nemotron 3 Nano Omni 30b A3b Reasoningmedium免费可用vsElephant Alphanone DeepSeek V4 FlashnonevsNemotron 3 Nano Omni 30b A3b Reasoningmedium免费可用 Nemotron 3 Nano Omni 30b A3b Reasoningmedium免费可用vsQwen3 Coder Nextnone Nemotron 3 Nano Omni 30b A3b Reasoningmedium免费可用vsGPT-5.4 Mininone Granite 4.1 8BnonevsQwen3.5-9Bmedium Nemotron 3 Nano Omni 30b A3b Reasoningmedium免费可用vsMiMo-V2.5none Ling-2.6-flashnonevsNemotron 3 Nano Omni 30b A3b Reasoningmedium免费可用 Nemotron 3 Nano Omni 30b A3b Reasoningmedium免费可用vsQwen3.6 35B A3Bnone Nemotron 3 Nano Omni 30b A3b Reasoningmedium免费可用vsgpt-oss-120bnone免费可用 Nemotron 3 Nano Omni 30b A3b Reasoningmedium免费可用vsGPT-4o-mininone