API error Failure Ranking

See which AI models run into API error most often, so you can spot reliability risks before choosing one.

Models Shown

Total Failures

161

Most Affected Model

Categories

In category Coding45 In category Combined26 In category Tool Calling17 In category Anti-AI Tricks14 In category Data parsing and extraction14 In category Trivia13 In category General Intelligence12 In category Puzzle Solving12 In category Domain specific7 In category Instructions following1

68/68

Rank	Model	Company	API error Count	Score	Total Cost	Tests Correct	Response Time (avg)
#74	GLM 5.1 medium	Z.ai	1	7.1	$0.535	13/22	46.8s
Total Tests 22 Wrong Tests 9 Total Cost $0.535 Response Time (avg) 46.8s
#81	KAT-Coder-Pro V2.5 medium	Kwaipilot	1	6.9	$0.467	11/22	24.0s
Total Tests 22 Wrong Tests 11 Total Cost $0.467 Response Time (avg) 24.0s
#84	MiMo-V2.5-Pro medium	Xiaomi	1	6.9	$0.187	12/22	33.9s
Total Tests 22 Wrong Tests 10 Total Cost $0.187 Response Time (avg) 33.9s
#91	LongCat 2.0 low	Meituan	1	6.7	$0.391	10/22	100.3s
Total Tests 22 Wrong Tests 12 Total Cost $0.391 Response Time (avg) 100.3s
#109	Mimo V2 PRO medium	Xiaomi	1	6.3	$0.333	12/21	22.2s
Total Tests 21 Wrong Tests 9 Total Cost $0.333 Response Time (avg) 22.2s
#113	MiMo-V2-Flash medium	Xiaomi	1	6.3	$0.043	12/21	20.1s
Total Tests 21 Wrong Tests 9 Total Cost $0.043 Response Time (avg) 20.1s
#114	Qwen3.5-Flash medium	Qwen	1	6.2	$0.139	12/22	84.8s
Total Tests 22 Wrong Tests 10 Total Cost $0.139 Response Time (avg) 84.8s
#119	Qwen3.5-35B-A3B medium	Qwen	1	6.2	$0.837	11/22	112.5s
Total Tests 22 Wrong Tests 11 Total Cost $0.837 Response Time (avg) 112.5s
#129	Nemotron 3 Ultra none	NVIDIA	1	6.1	$0.095	8/22	3.87s
Total Tests 22 Wrong Tests 14 Total Cost $0.095 Response Time (avg) 3.87s
#130	Step 3.5 Flash medium	Stepfun	1	6.0	$0.108	11/21	174.2s
Total Tests 21 Wrong Tests 10 Total Cost $0.108 Response Time (avg) 174.2s
#134	Mimo V2 Omni medium	Xiaomi	1	5.9	$0.683	10/21	41.2s
Total Tests 21 Wrong Tests 11 Total Cost $0.683 Response Time (avg) 41.2s
#137	North Mini Code medium	Cohere	1	5.9	$0.000	9/22	137.1s
Total Tests 22 Wrong Tests 13 Total Cost $0.000 Response Time (avg) 137.1s
#146	Owl Alpha medium	Openrouter	1	5.6	$0.000	8/21	11.9s
Total Tests 21 Wrong Tests 13 Total Cost $0.000 Response Time (avg) 11.9s
#147	Mimo V2 PRO none	Xiaomi	1	5.6	$0.045	7/21	2.27s
Total Tests 21 Wrong Tests 14 Total Cost $0.045 Response Time (avg) 2.27s
#149	KAT-Coder-Air V2.5 medium	Kwaipilot	1	5.6	$0.048	8/22	8.42s
Total Tests 22 Wrong Tests 14 Total Cost $0.048 Response Time (avg) 8.42s

←

1 2 3 4 5

→

API error Failures

Filter models

Top Models by API error Count

API error Count vs Score

Top Models by Response Time (avg)