AI BENCHY
Advertise here

AI BENCHY 分类

编程 排名

看看哪些 AI 模型在 编程 上表现最好,哪些更稳定,以及差距主要出现在哪里。 排序方式: 响应时间(平均) ↓.

显示的模型数

15

编程 得分 平均值

6.1

排名 模型 公司 编程 得分 分数 测试正确 响应时间(平均)
#102 GLM 5.1 none Z.ai 4.3 5.8 0/2 6.33s
#107 Qwen3.6 27B none Qwen 6.8 5.8 1/2 5.75s
#3 Gemini 3.5 Flash low Google 6.8 9.3 1/2 5.54s
#143 Qwen3.5-9B none Qwen 4.4 4.7 0/2 5.39s
#91 GLM 5 none Z.ai 4.6 6.3 0/2 5.18s
#147 Hy3 preview none Tencent 2.3 4.6 0/1 4.56s
#36 Gemini 3.1 Flash Lite Preview medium Google 6.8 7.7 1/2 3.98s
#92 Gemma 4 26B A4B none Google 4.1 6.2 0/2 3.83s
#99 GLM 5V Turbo none Z.ai 6.8 5.9 1/2 3.77s
#136 MiMo-V2.5 none Xiaomi 6.8 5.0 1/2 3.74s
#37 Gemini 3.1 Flash Lite medium Google 6.8 7.7 1/2 3.59s
#25 Gemini 3.5 Flash minimal Google 7.0 7.9 1/2 3.39s
#113 GLM 4.7 Flash none Z.ai 5.0 5.6 0/2 3.35s
#69 Qwen3.6 Max Preview none Qwen 4.2 7.1 0/2 3.06s
#134 Nemotron 3 Super none NVIDIA 3.4 5.0 0/2 3.02s

按 编程 得分 排名的顶级模型

编程 得分 vs 总成本

按 响应时间(平均) 排名的顶级模型