比较图表

语言:

❤️ Made by XCS

#33

GPT-5 Mini

OpenAI · 发布日期: 2025-08-07 · openai/gpt-5-mini::medium

平均分

5.77

每个结果成本

1.200

一致性

8.80

总成本

$0.084

测试正确

7

只有当某个测试的所有运行都通过时，才计为完全通过。

错误测试数

7

尝试通过率: 57.1%

不稳定测试

2

响应时间：平均 21.47s · 总计 300.64s · 最大 82.55s

未遵循指令: 3 答案错误: 3 超时: 1

按分数排名的模型

先选择第一个模型，再点击第二个模型打开并排页面。

#27 GLM 5 6.08

#28 Claude Opus 4.6 6.08

#29 MiMo-V2-Flash 6.00

#30 Qwen3.5-35B-A3B 5.93

#31 GPT-5 Nano 5.86

#32 Qwen3.5-Flash 5.79

#33 GPT-5 Mini 5.77

#34 gpt-oss-120b 5.65

#35 MiniMax M2.5 5.65

#36 Gemini 2.5 Flash 5.34

#37 Qwen3.5-122B-A10B 5.20

#38 GPT-4o-mini 4.86

#39 DeepSeek V3.2 4.70

快速对比

GPT-5 MinimediumvsQwen3.5-Flashmedium GPT-5 Minimediumvsgpt-oss-120bmedium免费可用 GPT-5 MinimediumvsGPT-5 Nanomedium GPT-5 MinimediumvsMiniMax M2.5medium GPT-5 MinimediumvsQwen3.5-35B-A3Bmedium GPT-5 MinimediumvsGemini 2.5 Flashnone GPT-5 MinimediumvsGemini 3 Flash Previewmedium GPT-5 MinimediumvsGemini 3.1 Pro Previewmedium GPT-5 MinimediumvsStep 3.5 Flashmedium免费可用

类别细分

类别	平均分	一致性	测试正确
Anti-AI Tricks	7.00	9.62	2/3
Data parsing and extraction	9.88	10.00	2/2
Domain specific	1.00	7.21	0/3
Instructions following	7.00	6.64	1/2
Puzzle Solving	4.34	9.78	1/3
Tool Calling	10.00	10.00	1/1