导航
AI BENCHY
Advertise here

AI BENCHY 对比

DeepSeek: DeepSeek V3.2 vs OpenAI: GPT-5.4 Nano

基准结果生成自 AI BENCHY 测试套件,时间:: 2026-06-01

指标 DeepSeek V3.2 DeepSeek V3.2 medium 发布日期: 2025-12-01 GPT-5.4 Nano GPT-5.4 Nano medium 发布日期: 2026-03-17
分数 6.9 7.2
排名 #81 #72
可靠性 10.0 10.0
一致性 7.9 8.8
测试正确
尝试通过率 63.3% 63.3%
不稳定测试 6 3
总运行次数 60 60
每个结果成本 0.335 0.900
总成本 $0.037 $0.099
输入价格 $0.252 / 1M $0.200 / 1M
输出价格 $0.378 / 1M $1.250 / 1M
输出令牌 7,177 2,993
推理令牌 68,297 70,928
响应时间(平均) 53.34s 11.79s
响应时间(最大) 189.03s 94.06s
响应时间(总计) 1066.71s 235.81s

按分数排名的模型

分数 vs 总成本

响应时间(平均)

分数 vs 响应时间(平均)

总输出令牌

分数 vs 总输出令牌

类别细分

反AI技巧 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输出令牌 推理令牌
DeepSeek V3.2 8.7 10.0 83.3% 1 24.23s 3,247 6,953
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 683 2,254
编程 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输出令牌 推理令牌
DeepSeek V3.2 3.9 5.8 33.3% 1 184.97s 640 21,230
GPT-5.4 Nano 6.8 6.2 66.7% 1 21.10s 495 15,186
综合 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输出令牌 推理令牌
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 571 6,296
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 349 5,719
数据解析与提取 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输出令牌 推理令牌
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 207 7,693
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 234 516
领域专项 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输出令牌 推理令牌
DeepSeek V3.2 2.9 4.4 22.2% 2 24.27s 21 6,838
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 60 43,325
通用智能 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输出令牌 推理令牌
DeepSeek V3.2 3.4 2.5 33.3% 1 58.29s 49 2,189
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 179 443
指令遵循 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输出令牌 推理令牌
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 1,397 2,845
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 95 521
谜题求解 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输出令牌 推理令牌
DeepSeek V3.2 7.0 7.2 55.6% 1 37.69s 518 6,375
GPT-5.4 Nano 4.1 7.2 22.2% 1 3.79s 594 1,408
工具调用 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输出令牌 推理令牌
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 507 859
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 234 382
常识问答 分数 一致性 尝试通过率 不稳定测试 测试正确 响应时间(平均) 输出令牌 推理令牌
DeepSeek V3.2 3.0 10.0 0.0% 0 83.99s 20 7,019
GPT-5.4 Nano 3.0 10.0 0.0% 0 4.81s 70 1,174

快速对比

切换对比组合