AI BENCHY
Advertise here

AI BENCHY 分类

领域专项 排名

看看哪些 AI 模型在 领域专项 上表现最好,哪些更稳定,以及差距主要出现在哪里。

显示的模型数

15

领域专项 得分 平均值

4.8

排名 模型 公司 领域专项 得分 分数 测试正确 响应时间(平均)
#73 Seed-2.0-Mini medium Bytedance Seed 3.0 6.9 0/3 0ms
#79 Hunter Alpha medium OpenRouter 3.0 6.7 0/3 10.5s
#80 Mimo V2 Omni medium Xiaomi 3.0 6.7 0/3 47.9s
#88 Qwen3.7 Plus none Qwen 3.0 6.4 0/3 868ms
#93 Qwen3.6 Plus Preview medium Qwen 3.0 6.3 0/3 22.1s
#98 GLM 5 none Z.ai 3.0 6.1 0/3 2.24s
#106 Grok 4.20 Beta none X AI 3.0 5.8 0/3 611ms
#115 Qwen3.5-27B none Qwen 3.0 5.7 0/3 540ms
#126 gpt-oss-120b none OpenAI 3.0 5.4 0/3 35.0s
#127 Grok 4.20 none X AI 3.0 5.4 0/3 687ms
#130 MiniMax M2.7 medium Minimax 3.0 5.3 0/3 19.0s
#136 Elephant Alpha medium Openrouter 3.0 5.1 0/3 925ms
#137 Elephant Alpha none Openrouter 3.0 5.1 0/3 927ms
#138 Ling-2.6-flash none Inclusionai 3.0 5.0 0/3 4.95s
#143 MiMo-V2.5 none Xiaomi 3.0 4.9 0/3 756ms

按 领域专项 得分 排名的顶级模型

领域专项 得分 vs 总成本

按 响应时间(平均) 排名的顶级模型