超时失败排名 | AI BENCHY

比较图表方法论

语言:

❤️ Made by XCS

AI BENCHY 失败分析

看看哪些 AI 模型最常遇到超时，让你在选择前先发现稳定性风险。

显示的模型数

15

失败总数

25

受影响最多的模型

Seed-2.0-Mini 4

相关分类

领域专项17 谜题求解4 通用智能3 反AI技巧1

排名	模型	公司	超时次数	平均分	测试正确	响应时间（平均）
#23	Seed-2.0-Mini medium	Bytedance Seed	4	6.9	10/16	65.1s
#35	Qwen3.5-35B-A3B medium	Qwen	4	5.5	8/16	43.9s
#24	Qwen3.5-Flash medium	Qwen	3	6.9	10/16	70.8s
#4	Qwen3.5 Plus 2026-02-15 medium	Qwen	2	8.3	13/16	34.5s
#43	MiniMax M2.5 medium	Minimax	2	4.7	5/16	43.0s
#7	Qwen3.5-27B medium	Qwen	1	8.2	12/16	52.1s
#10	Qwen3.5-122B-A10B medium	Qwen	1	7.7	12/16	29.7s
#11	Claude Sonnet 4.6 medium	Anthropic	1	7.7	12/16	11.2s
#14	GLM 5 medium	Z.ai	1	7.4	11/16	16.2s
#18	DeepSeek V3.2 medium	DeepSeek	1	7.3	11/16	39.5s
#27	GPT-5.2 medium	OpenAI	1	6.5	10/16	15.3s
#28	Kimi K2.5 medium	Moonshot AI	1	6.4	9/16	69.8s
#30	Grok 4.1 Fast medium	X AI	1	6.2	9/16	26.3s
#32	GPT-5 Mini medium	OpenAI	1	6.0	8/16	25.1s
#34	GPT-5 Nano medium	OpenAI	1	5.5	7/16	47.9s

按超时次数排名的顶级模型

超时次数 vs 平均分

按响应时间（平均）排名的顶级模型