AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY 分类

反AI技巧 排名

看看哪些 AI 模型在 反AI技巧 上表现最好,哪些更稳定,以及差距主要出现在哪里。 排序方式: 测试正确 ↓.

显示的模型数

15

反AI技巧 得分 平均值

6.9

排名 模型 公司 反AI技巧 得分 分数 测试正确 响应时间(平均)
#55 GLM 5.1 medium Z.ai 10.0 7.3 4/4 8.31s
#56 MiMo-V2.5 medium Xiaomi 10.0 7.3 4/4 4.14s
#62 Step 3.5 Flash medium Stepfun 10.0 7.2 4/4 40.6s
#66 Qwen3.5-35B-A3B medium Qwen 10.0 7.1 4/4 21.1s
#71 Step 3.7 Flash high Stepfun 10.0 7.0 4/4 13.4s
#75 Ring-2.6-1T medium Inclusionai 10.0 6.9 4/4 42.2s
#80 Mimo V2 Omni medium Xiaomi 10.0 6.7 4/4 2.75s
#83 Step 3.5 Flash none Stepfun 10.0 6.6 4/4 35.0s
#8 Claude Opus 4.7 none Anthropic 8.3 8.9 3/4 2.12s
#11 Claude Opus 4.7 medium Anthropic 8.3 8.7 3/4 1.85s
#13 Grok 4.20 Beta medium X AI 8.7 8.5 3/4 3.16s
#15 GPT-5.3-Codex medium OpenAI 8.7 8.4 3/4 4.16s
#19 Seed-2.0-Lite medium Bytedance Seed 8.3 8.2 3/4 18.0s
#21 GPT-5.4 medium OpenAI 8.3 8.0 3/4 4.11s
#22 Step 3.7 Flash medium Stepfun 8.7 8.0 3/4 9.65s

按 反AI技巧 得分 排名的顶级模型

反AI技巧 得分 vs 总成本

按 响应时间(平均) 排名的顶级模型