AI BENCHY 分类
综合 排名
看看哪些 AI 模型在 综合 上表现最好,哪些更稳定,以及差距主要出现在哪里。 排序方式: 测试正确 ↑.
| 排名 | 模型 | 公司 | 综合 得分 | 分数 | 测试正确 | 响应时间(平均) |
|---|---|---|---|---|---|---|
| #45 | GPT-5 Mini medium | OpenAI | 10.0 | 7.0 | 1/1 | 88.2s |
| #46 | Kimi K2.5 medium | Moonshot AI | 10.0 | 7.0 | 1/1 | 71.4s |
| #47 | Grok 4.20 medium | X AI | 10.0 | 7.0 | 1/1 | 17.4s |
| #51 | Nemotron 3 Super medium | NVIDIA | 10.0 | 6.7 | 1/1 | 87.8s |
| #52 | Grok 4.1 Fast medium | X AI | 10.0 | 6.7 | 1/1 | 37.6s |
| #54 | Mercury 2 medium | Inception | 10.0 | 6.5 | 1/1 | 3.28s |
| #57 | GPT-5 Nano medium | OpenAI | 10.0 | 6.3 | 1/1 | 66.0s |
| #68 | gpt-oss-120b medium | OpenAI | 10.0 | 5.8 | 1/1 | 31.2s |