导航
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY 对比

MiniMax: MiniMax M2.7 vs NVIDIA: Nemotron 3 Super

摘要

MiniMax M2.7 vs Nemotron 3 Super benchmark 对比:Nemotron 3 Super 平均分领先,为 6.3 vs 5.2Nemotron 3 Super benchmark 成本更低,为 $0.021 vs $0.104Nemotron 3 Super 更快,为 32.00s vs 38.18s,通过率为 46.0% vs 41.3%

推荐模型: Nemotron 3 Super - 它在这里得分最高(6.3),同时成本比MiniMax M2.7低约 5.1 倍。

基准结果生成自 AI BENCHY 测试套件,时间:: 2026-06-18

指标 MiniMax M2.7 MiniMax M2.7 medium 发布日期: 2026-03-18 Nemotron 3 Super Nemotron 3 Super medium 发布日期: 2026-03-11 免费可用
分数 5.2 6.3
排名 #127 #87
可靠性 10.0 10.0
一致性 6.8 9.2
测试正确
尝试通过率 46.0% 41.3%
不稳定测试 8 2
总运行次数 63 63
每个结果成本 2.494 0.004
总成本 $0.104 $0.021
输入价格 $0.250 / 1M $0.090 / 1M
输出价格 $1.000 / 1M $0.450 / 1M
总输入令牌 34,371 37,527
输出令牌 8,981 14,850
推理令牌 89,812 33,754
响应时间(平均) 38.18s 32.00s
响应时间(最大) 196.21s 232.25s
响应时间(总计) 763.60s 607.91s

生成展示

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#127 MiniMax M2.7

medium
成本
$0.022
时间
22.8s
令牌
9,250 tok

#87 Nemotron 3 Super

medium
成本
$0.000
时间
272.6s
令牌
5,296 tok

按分数排名的模型

分数 vs 总成本

响应时间(平均)

分数 vs 响应时间(平均)

总输出令牌

分数 vs 总输出令牌

类别细分

反AI技巧 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输入令牌 输出令牌 推理令牌
MiniMax M2.7 7.9 6.3 83.3% 2 40.32s 654 3,010 17,716
Nemotron 3 Super 8.3 10.0 75.0% 0 7.85s 686 748 1,305
编程 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输入令牌 输出令牌 推理令牌
MiniMax M2.7 5.7 9.1 33.3% 0 101.89s 2,961 1,231 38,841
Nemotron 3 Super 3.1 10.0 0.0% 0 147.32s 2,275 797 4,424
综合 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输入令牌 输出令牌 推理令牌
MiniMax M2.7 4.7 1.6 66.7% 1 41.03s 14,233 369 4,480
Nemotron 3 Super 10.0 10.0 100.0% 0 87.80s 15,561 2,021 9,996
数据解析与提取 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输入令牌 输出令牌 推理令牌
MiniMax M2.7 6.3 5.8 66.7% 1 21.95s 7,152 187 5,882
Nemotron 3 Super 10.0 10.0 100.0% 0 18.16s 7,944 877 2,607
领域专项 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输入令牌 输出令牌 推理令牌
MiniMax M2.7 3.0 10.0 0.0% 0 19.00s 245 8 2,796
Nemotron 3 Super 2.9 4.4 22.2% 2 16.19s 456 5,255 6,072
通用智能 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输入令牌 输出令牌 推理令牌
MiniMax M2.7 3.9 2.5 33.3% 1 38.70s 486 92 5,204
Nemotron 3 Super 4.1 10.0 0.0% 0 6.91s 492 105 363
指令遵循 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输入令牌 输出令牌 推理令牌
MiniMax M2.7 3.8 5.8 33.3% 1 12.80s 687 350 2,600
Nemotron 3 Super 7.3 10.0 50.0% 0 6.97s 723 956 2,383
谜题求解 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输入令牌 输出令牌 推理令牌
MiniMax M2.7 5.9 7.2 55.6% 1 24.87s 675 362 7,840
Nemotron 3 Super 3.0 10.0 0.0% 0 3.15s 708 570 1,322
工具调用 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输入令牌 输出令牌 推理令牌
MiniMax M2.7 4.7 1.6 66.7% 1 12.05s 7,067 304 1,001
Nemotron 3 Super 10.0 10.0 100.0% 0 39.75s 8,544 270 1,969
常识问答 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输入令牌 输出令牌 推理令牌
MiniMax M2.7 3.0 10.0 0.0% 0 22.77s 211 3,068 3,452
Nemotron 3 Super 3.0 10.0 0.0% 0 55.32s 138 3,251 3,313

快速对比

切换对比组合