AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY 分类

综合 排名

看看哪些 AI 模型在 综合 上表现最好,哪些更稳定,以及差距主要出现在哪里。 排序方式: 测试正确 ↑.

显示的模型数

15

综合 得分 平均值

6.3

排名 模型 公司 综合 得分 分数 测试正确 响应时间(平均)
#102 Gemma 4 26B A4B none Google 3.0 6.0 0/1 30.5s
#104 Nemotron 3 Ultra 550b A55b none NVIDIA 3.0 6.0 0/1 4.79s
#106 Grok 4.20 Beta none X AI 3.0 5.8 0/1 6.48s
#107 Laguna Xs.2 medium Poolside 3.0 5.8 0/1 15.9s
#108 Qwen3.5-Flash none Qwen 3.0 5.8 0/1 6.22s
#109 GLM 5V Turbo none Z.ai 3.0 5.8 0/1 6.51s
#110 Seed-2.0-Lite none Bytedance Seed 3.0 5.8 0/1 6.59s
#111 Owl Alpha medium Openrouter 3.0 5.7 0/1 10.0s
#112 GLM 5.1 none Z.ai 2.8 5.7 0/1 32.6s
#114 Qwen3.5 Plus 2026-04-20 none Qwen 2.8 5.7 0/1 13.3s
#115 Qwen3.5-27B none Qwen 2.8 5.7 0/1 9.39s
#116 Hunter Alpha none OpenRouter 3.0 5.7 0/1 15.2s
#117 Qwen3.5-35B-A3B none Qwen 3.0 5.6 0/1 47.4s
#118 Qwen3.6 27B none Qwen 3.0 5.6 0/1 9.95s
#119 Cobuddy medium Baidu 3.0 5.6 0/1 47.4s

按 综合 得分 排名的顶级模型

综合 得分 vs 总成本

按 响应时间(平均) 排名的顶级模型