Classement des échecs pour Erreur API

Voyez quels modèles d'IA rencontrent le plus souvent Erreur API, pour repérer les risques de fiabilité avant de choisir.

Modèles affichés

Échecs totaux

161

Modèle le plus touché

Qwen3.6 Plus Preview 8

Catégories

Dans la catégorie Programmation45 Dans la catégorie Combiné26 Dans la catégorie Appel d'outils17 Dans la catégorie Analyse et extraction des données14 Dans la catégorie Astuces anti-IA14 Dans la catégorie Culture générale13 Dans la catégorie Intelligence générale12 Dans la catégorie Résolution d'énigmes12 Dans la catégorie Spécifique au domaine7 Dans la catégorie Suivi des instructions1

68/68

Rang	Modèle	Entreprise	Nombre de Erreur API	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#74	GLM 5.1 medium	Z.ai	1	7.1	$0.535	13/22	46.8s
Tests totaux 22 Tests incorrects 9 Coût total $0.535 Temps de réponse (moy.) 46.8s
#81	KAT-Coder-Pro V2.5 medium	Kwaipilot	1	6.9	$0.467	11/22	24.0s
Tests totaux 22 Tests incorrects 11 Coût total $0.467 Temps de réponse (moy.) 24.0s
#84	MiMo-V2.5-Pro medium	Xiaomi	1	6.9	$0.187	12/22	33.9s
Tests totaux 22 Tests incorrects 10 Coût total $0.187 Temps de réponse (moy.) 33.9s
#91	LongCat 2.0 low	Meituan	1	6.7	$0.391	10/22	100.3s
Tests totaux 22 Tests incorrects 12 Coût total $0.391 Temps de réponse (moy.) 100.3s
#109	Mimo V2 PRO medium	Xiaomi	1	6.3	$0.333	12/21	22.2s
Tests totaux 21 Tests incorrects 9 Coût total $0.333 Temps de réponse (moy.) 22.2s
#113	MiMo-V2-Flash medium	Xiaomi	1	6.3	$0.043	12/21	20.1s
Tests totaux 21 Tests incorrects 9 Coût total $0.043 Temps de réponse (moy.) 20.1s
#114	Qwen3.5-Flash medium	Qwen	1	6.2	$0.139	12/22	84.8s
Tests totaux 22 Tests incorrects 10 Coût total $0.139 Temps de réponse (moy.) 84.8s
#119	Qwen3.5-35B-A3B medium	Qwen	1	6.2	$0.837	11/22	112.5s
Tests totaux 22 Tests incorrects 11 Coût total $0.837 Temps de réponse (moy.) 112.5s
#129	Nemotron 3 Ultra none	NVIDIA	1	6.1	$0.095	8/22	3.87s
Tests totaux 22 Tests incorrects 14 Coût total $0.095 Temps de réponse (moy.) 3.87s
#130	Step 3.5 Flash medium	Stepfun	1	6.0	$0.108	11/21	174.2s
Tests totaux 21 Tests incorrects 10 Coût total $0.108 Temps de réponse (moy.) 174.2s
#134	Mimo V2 Omni medium	Xiaomi	1	5.9	$0.683	10/21	41.2s
Tests totaux 21 Tests incorrects 11 Coût total $0.683 Temps de réponse (moy.) 41.2s
#137	North Mini Code medium	Cohere	1	5.9	$0.000	9/22	137.1s
Tests totaux 22 Tests incorrects 13 Coût total $0.000 Temps de réponse (moy.) 137.1s
#146	Owl Alpha medium	Openrouter	1	5.6	$0.000	8/21	11.9s
Tests totaux 21 Tests incorrects 13 Coût total $0.000 Temps de réponse (moy.) 11.9s
#147	Mimo V2 PRO none	Xiaomi	1	5.6	$0.045	7/21	2.27s
Tests totaux 21 Tests incorrects 14 Coût total $0.045 Temps de réponse (moy.) 2.27s
#149	KAT-Coder-Air V2.5 medium	Kwaipilot	1	5.6	$0.048	8/22	8.42s
Tests totaux 22 Tests incorrects 14 Coût total $0.048 Temps de réponse (moy.) 8.42s

←

1 2 3 4 5

→

Échecs Erreur API

Filtrer les modèles

Meilleurs modèles par Nombre de Erreur API

Nombre de Erreur API vs Score

Meilleurs modèles par Temps de réponse (moy.)