Classement des échecs pour Erreur API

Voyez quels modèles d'IA rencontrent le plus souvent Erreur API, pour repérer les risques de fiabilité avant de choisir.

Modèles affichés

Échecs totaux

159

Modèle le plus touché

Qwen3.6 Plus Preview 8

Catégories

Dans la catégorie Programmation44 Dans la catégorie Combiné25 Dans la catégorie Appel d'outils17 Dans la catégorie Analyse et extraction des données14 Dans la catégorie Astuces anti-IA14 Dans la catégorie Culture générale13 Dans la catégorie Intelligence générale12 Dans la catégorie Résolution d'énigmes12 Dans la catégorie Spécifique au domaine7 Dans la catégorie Suivi des instructions1

66/66

Rang	Modèle	Entreprise	Nombre de Erreur API	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#171	Qwen3.6 Plus Preview medium	Qwen	8	4.9	$0.000	9/19	15.2s
Tests totaux 19 Tests incorrects 10 Coût total $0.000 Temps de réponse (moy.) 15.2s
#131	Hy3 preview high	Tencent	7	5.9	$0.048	11/21	56.6s
Tests totaux 21 Tests incorrects 10 Coût total $0.048 Temps de réponse (moy.) 56.6s
#149	Hy3 preview low	Tencent	7	5.5	$0.015	10/21	24.6s
Tests totaux 21 Tests incorrects 11 Coût total $0.015 Temps de réponse (moy.) 24.6s
#175	Ring-2.6-1T none	Inclusionai	6	4.8	$0.026	9/22	55.1s
Tests totaux 22 Tests incorrects 13 Coût total $0.026 Temps de réponse (moy.) 55.1s
#203	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	6	3.4	$0.000	4/19	17.1s
Tests totaux 19 Tests incorrects 15 Coût total $0.000 Temps de réponse (moy.) 17.1s
#204	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	6	3.2	$0.000	2/19	728ms
Tests totaux 19 Tests incorrects 17 Coût total $0.000 Temps de réponse (moy.) 728ms
#78	Gemini 3.5 Flash none	Google	4	7.0	$1.079	15/22	9.93s
Tests totaux 22 Tests incorrects 7 Coût total $1.079 Temps de réponse (moy.) 9.93s
#129	Gemini 3 PRO Preview medium	Google	4	6.0	$0.385	14/21	9.05s
Tests totaux 21 Tests incorrects 7 Coût total $0.385 Temps de réponse (moy.) 9.05s
#136	Nemotron 3 Super medium	NVIDIA	4	5.7	$0.066	8/22	52.0s
Tests totaux 22 Tests incorrects 14 Coût total $0.066 Temps de réponse (moy.) 52.0s
#169	DeepSeek V3.2 none	DeepSeek	4	5.0	$0.054	6/22	18.3s
Tests totaux 22 Tests incorrects 16 Coût total $0.054 Temps de réponse (moy.) 18.3s
#182	Laguna M.1 medium	Poolside	4	4.7	$0.033	9/19	14.7s
Tests totaux 19 Tests incorrects 10 Coût total $0.033 Temps de réponse (moy.) 14.7s
#188	Laguna M.1 none	Poolside	4	4.4	$0.009	4/19	2.89s
Tests totaux 19 Tests incorrects 15 Coût total $0.009 Temps de réponse (moy.) 2.89s
#194	Laguna Xs.2 medium	Poolside	4	4.1	$0.015	6/19	6.73s
Tests totaux 19 Tests incorrects 13 Coût total $0.015 Temps de réponse (moy.) 6.73s
#195	Hy3 preview none	Tencent	4	4.0	$0.003	4/21	12.9s
Tests totaux 21 Tests incorrects 17 Coût total $0.003 Temps de réponse (moy.) 12.9s
#201	Laguna Xs.2 none	Poolside	4	3.8	$0.004	5/19	806ms
Tests totaux 19 Tests incorrects 14 Coût total $0.004 Temps de réponse (moy.) 806ms

1 2 3 4 5

→

Échecs Erreur API

Filtrer les modèles

Meilleurs modèles par Nombre de Erreur API

Nombre de Erreur API vs Score

Meilleurs modèles par Temps de réponse (moy.)