Classement des échecs pour Erreur API

Voyez quels modèles d'IA rencontrent le plus souvent Erreur API, pour repérer les risques de fiabilité avant de choisir.

Modèles affichés

Échecs totaux

161

Modèle le plus touché

Qwen3.6 Plus Preview 8

Catégories

Dans la catégorie Programmation45 Dans la catégorie Combiné26 Dans la catégorie Appel d'outils17 Dans la catégorie Analyse et extraction des données14 Dans la catégorie Astuces anti-IA14 Dans la catégorie Culture générale13 Dans la catégorie Intelligence générale12 Dans la catégorie Résolution d'énigmes12 Dans la catégorie Spécifique au domaine7 Dans la catégorie Suivi des instructions1

68/68

Rang	Modèle	Entreprise	Nombre de Erreur API	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#158	KAT-Coder-Air V2.5 low	Kwaipilot	2	5.4	$0.041	7/22	10.1s
Tests totaux 22 Tests incorrects 15 Coût total $0.041 Temps de réponse (moy.) 10.1s
#161	Qwen3.6 35B A3B none	Qwen	2	5.3	$0.061	4/22	5.52s
Tests totaux 22 Tests incorrects 18 Coût total $0.061 Temps de réponse (moy.) 5.52s
#167	Mistral Small 4 medium	Mistral	2	5.1	$0.096	5/22	10.8s
Tests totaux 22 Tests incorrects 17 Coût total $0.096 Temps de réponse (moy.) 10.8s
#178	Ling-2.6-flash none	Inclusionai	2	4.9	$0.002	6/22	10.7s
Tests totaux 22 Tests incorrects 16 Coût total $0.002 Temps de réponse (moy.) 10.7s
#181	Grok 4.20 Multi Agent Beta medium	X AI	2	4.8	$5.599	8/18	9.69s
Tests totaux 18 Tests incorrects 10 Coût total $5.599 Temps de réponse (moy.) 9.69s
#183	Trinity Large Preview none	Arcee AI	2	4.8	$0.008	4/21	2.98s
Tests totaux 21 Tests incorrects 17 Coût total $0.008 Temps de réponse (moy.) 2.98s
#27	Muse Spark 1.1 high	Meta	1	8.1	$1.694	12/22	31.5s
Tests totaux 22 Tests incorrects 10 Coût total $1.694 Temps de réponse (moy.) 31.5s
#32	Inkling medium	Thinkingmachines	1	8.0	$0.391	15/22	16.2s
Tests totaux 22 Tests incorrects 7 Coût total $0.391 Temps de réponse (moy.) 16.2s
#37	Qwen3.6 Plus medium	Qwen	1	7.8	$0.405	15/22	43.1s
Tests totaux 22 Tests incorrects 7 Coût total $0.405 Temps de réponse (moy.) 43.1s
#46	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
Tests totaux 22 Tests incorrects 12 Coût total $0.200 Temps de réponse (moy.) 79.1s
#51	Nemotron 3 Ultra medium	NVIDIA	1	7.5	$0.774	13/22	32.2s
Tests totaux 22 Tests incorrects 9 Coût total $0.774 Temps de réponse (moy.) 32.2s
#52	Kimi K2.7 Code medium	Moonshot AI	1	7.5	$0.751	12/22	84.2s
Tests totaux 22 Tests incorrects 10 Coût total $0.751 Temps de réponse (moy.) 84.2s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	1	7.5	$0.437	14/22	89.2s
Tests totaux 22 Tests incorrects 8 Coût total $0.437 Temps de réponse (moy.) 89.2s
#60	LongCat 2.0 medium	Meituan	1	7.4	$0.478	12/22	136.6s
Tests totaux 22 Tests incorrects 10 Coût total $0.478 Temps de réponse (moy.) 136.6s
#62	KAT-Coder-Pro V2.5 low	Kwaipilot	1	7.4	$0.387	11/22	19.5s
Tests totaux 22 Tests incorrects 11 Coût total $0.387 Temps de réponse (moy.) 19.5s

←

1 2 3 4 5

→

Échecs Erreur API

Filtrer les modèles

Meilleurs modèles par Nombre de Erreur API

Nombre de Erreur API vs Score

Meilleurs modèles par Temps de réponse (moy.)