AI BENCHY
比较 图表 方法论
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY 失败分析

API 错误 失败

看看哪些 AI 模型最常遇到 API 错误,让你在选择前先发现稳定性风险。 排序方式: 响应时间(平均) ↑.

显示的模型数

5

失败总数

8

受影响最多的模型

LFM2-24B-A2B 4
排名 模型 公司 API 错误 次数 平均分 测试正确 响应时间(平均)
#55 LFM2-24B-A2B none Liquid 4 2.6 1/16 811ms
#54 MiMo-V2-Flash none Xiaomi 1 2.9 3/16 2.97s
#21 MiMo-V2-Flash medium Xiaomi 1 7.2 11/16 25.3s
#35 Qwen3.5-35B-A3B medium Qwen 1 5.5 8/16 43.9s
#24 Qwen3.5-Flash medium Qwen 1 6.9 10/16 70.8s

按 API 错误 次数 排名的顶级模型

API 错误 次数 vs 平均分

按 响应时间(平均) 排名的顶级模型