AI BENCHY 分类
反AI技巧 排名
看看哪些 AI 模型在 反AI技巧 上表现最好,哪些更稳定,以及差距主要出现在哪里。 排序方式: 响应时间(平均) ↑.
| 排名 | 模型 | 公司 | 反AI技巧 得分 | 分数 | 测试正确 | 响应时间(平均) |
|---|---|---|---|---|---|---|
| #153 | Qwen3.6 35B A3B none | Qwen | 3.6 | 4.6 | 0/4 | 2.10s |
| #112 | GLM 5.1 none | Z.ai | 4.0 | 5.7 | 0/4 | 2.11s |
| #50 | Gemini 3.1 Flash Lite Preview low | 8.3 | 7.4 | 3/4 | 2.12s | |
| #8 | Claude Opus 4.7 none | Anthropic | 8.3 | 8.9 | 3/4 | 2.12s |
| #143 | MiMo-V2.5 none | Xiaomi | 3.5 | 4.9 | 0/4 | 2.19s |
| #40 | Gemini 3.1 Flash Lite Preview medium | 9.1 | 7.5 | 3/4 | 2.33s | |
| #104 | Nemotron 3 Ultra 550b A55b none | NVIDIA | 3.5 | 6.0 | 0/4 | 2.35s |
| #98 | GLM 5 none | Z.ai | 4.8 | 6.1 | 1/4 | 2.37s |
| #44 | Gemini 3.1 Flash Lite medium | 9.1 | 7.5 | 3/4 | 2.39s | |
| #110 | Seed-2.0-Lite none | Bytedance Seed | 3.0 | 5.8 | 0/4 | 2.43s |
| #3 | Gemini 3.5 Flash low | 10.0 | 9.4 | 4/4 | 2.52s | |
| #20 | Gemini 3.5 Flash none | 10.0 | 8.1 | 4/4 | 2.53s | |
| #2 | Gemini 3.5 Flash high | 10.0 | 9.6 | 4/4 | 2.57s | |
| #74 | Qwen3.6 Max Preview none | Qwen | 5.2 | 6.9 | 1/4 | 2.63s |
| #132 | Mistral Small 4 medium | Mistral | 5.6 | 5.3 | 1/4 | 2.67s |