AI BENCHY
Advertise here

AI BENCHY 分类

领域专项 排名

看看哪些 AI 模型在 领域专项 上表现最好,哪些更稳定,以及差距主要出现在哪里。 排序方式: 响应时间(平均) ↑.

显示的模型数

15

领域专项 得分 平均值

4.8

最佳模型

GLM 5 3.5
排名 模型 公司 领域专项 得分 分数 测试正确 响应时间(平均)
#91 GPT-5.5 none OpenAI 2.9 6.4 0/3 1.31s
#110 Seed-2.0-Lite none Bytedance Seed 3.6 5.8 0/3 1.33s
#124 Kimi K2.6 none Moonshot AI 5.3 5.5 1/3 1.48s
#61 Gemini 3.1 Flash Lite low Google 5.3 7.2 1/3 1.52s
#68 Claude Opus 4.8 none Anthropic 5.3 7.0 1/3 1.66s
#120 Mimo V2 PRO none Xiaomi 5.3 5.6 1/3 1.78s
#134 GLM 5 Turbo none Z.ai 5.3 5.2 1/3 1.97s
#112 GLM 5.1 none Z.ai 2.9 5.7 0/3 1.99s
#109 GLM 5V Turbo none Z.ai 5.3 5.8 1/3 2.09s
#101 Mimo V2 Omni none Xiaomi 5.3 6.0 1/3 2.10s
#98 GLM 5 none Z.ai 3.0 6.1 0/3 2.24s
#116 Hunter Alpha none OpenRouter 5.3 5.7 1/3 2.33s
#50 Gemini 3.1 Flash Lite Preview low Google 5.3 7.4 1/3 2.36s
#102 Gemma 4 26B A4B none Google 3.6 6.0 0/3 2.49s
#121 Owl Alpha none Openrouter 5.3 5.5 1/3 3.00s

按 领域专项 得分 排名的顶级模型

领域专项 得分 vs 总成本

按 响应时间(平均) 排名的顶级模型