AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY 分类

编程 排名

看看哪些 AI 模型在 编程 上表现最好,哪些更稳定,以及差距主要出现在哪里。 排序方式: 响应时间(平均) ↓.

显示的模型数

15

编程 得分 平均值

6.1

排名 模型 公司 编程 得分 分数 测试正确 响应时间(平均)
#100 Seed-2.0-Lite none Bytedance Seed 6.8 5.9 1/2 2.95s
#124 Laguna M.1 none Poolside 7.5 5.4 0/1 2.93s
#10 Claude Opus 4.7 none Anthropic 10.0 8.9 1/1 2.84s
#93 MiMo-V2-Omni none Xiaomi 5.1 6.2 0/2 2.75s
#110 MiMo-V2-Pro none Xiaomi 6.8 5.7 1/2 2.65s
#127 GLM 5 Turbo none Z.ai 4.4 5.3 0/2 2.58s
#89 Qwen3.5 Plus 2026-02-15 none Qwen 4.9 6.4 0/2 2.54s
#117 Qwen3.6 Flash none Qwen 6.6 5.5 1/2 2.34s
#87 Mercury 2 medium Inception 7.2 6.5 1/2 2.29s
#41 Gemini 3 Flash Preview none Google 6.8 7.7 1/2 2.19s
#125 Qwen3.5-122B-A10B none Qwen 4.0 5.4 0/2 2.14s
#103 Qwen3.5 Plus 2026-04-20 none Qwen 4.4 5.8 0/2 2.08s
#139 GPT-4o-mini none OpenAI 3.2 4.9 0/2 2.05s
#144 MiMo-V2-Flash none Xiaomi 4.9 4.7 0/2 2.04s
#133 Qwen3 Coder Next none Qwen 5.4 5.1 0/2 2.01s

按 编程 得分 排名的顶级模型

编程 得分 vs 总成本

按 响应时间(平均) 排名的顶级模型