Classement des échecs pour Aucune réponse

Voyez quels modèles d'IA rencontrent le plus souvent Aucune réponse, pour repérer les risques de fiabilité avant de choisir.

Modèles affichés

Échecs totaux

Modèle le plus touché

Step 3.7 Flash 4

Catégories

Dans la catégorie Combiné29 Dans la catégorie Programmation18 Dans la catégorie Culture générale12 Dans la catégorie Spécifique au domaine8 Dans la catégorie Analyse et extraction des données5 Dans la catégorie Astuces anti-IA4 Dans la catégorie Résolution d'énigmes3 Dans la catégorie Appel d'outils2 Dans la catégorie Suivi des instructions2

64/64

Rang	Modèle	Entreprise	Nombre de Aucune réponse	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#85	Step 3.7 Flash high	Stepfun	4	6.9	$1.207	11/22	64.7s
Tests totaux 22 Tests incorrects 11 Coût total $1.207 Temps de réponse (moy.) 64.7s
#96	Qwen3.6 27B medium	Qwen	3	6.5	$0.779	10/22	106.3s
Tests totaux 22 Tests incorrects 12 Coût total $0.779 Temps de réponse (moy.) 106.3s
#190	GLM 4.7 Flash medium	Z.ai	3	4.3	$0.166	4/22	142.6s
Tests totaux 22 Tests incorrects 18 Coût total $0.166 Temps de réponse (moy.) 142.6s
#12	Grok 4.5 high	X AI	2	8.9	$1.707	17/22	76.5s
Tests totaux 22 Tests incorrects 5 Coût total $1.707 Temps de réponse (moy.) 76.5s
#17	Claude Fable 5 medium	Anthropic	2	8.6	$3.478	17/22	17.2s
Tests totaux 22 Tests incorrects 5 Coût total $3.478 Temps de réponse (moy.) 17.2s
#38	GLM 5.2 medium	Z.ai	2	7.8	$0.068	15/21	23.3s
Tests totaux 21 Tests incorrects 6 Coût total $0.068 Temps de réponse (moy.) 23.3s
#76	Kimi K2.5 medium	Moonshot AI	2	7.0	$0.600	10/22	99.0s
Tests totaux 22 Tests incorrects 12 Coût total $0.600 Temps de réponse (moy.) 99.0s
#93	Gemma 4 26B A4B medium	Google	2	6.6	$0.082	14/22	103.8s
Tests totaux 22 Tests incorrects 8 Coût total $0.082 Temps de réponse (moy.) 103.8s
#108	Claude Sonnet 5 none	Anthropic	2	6.3	$0.548	8/22	6.04s
Tests totaux 22 Tests incorrects 14 Coût total $0.548 Temps de réponse (moy.) 6.04s
#115	Qwen3.5-35B-A3B medium	Qwen	2	6.2	$0.837	11/22	112.5s
Tests totaux 22 Tests incorrects 11 Coût total $0.837 Temps de réponse (moy.) 112.5s
#130	Mimo V2 Omni medium	Xiaomi	2	5.9	$0.683	10/21	41.2s
Tests totaux 21 Tests incorrects 11 Coût total $0.683 Temps de réponse (moy.) 41.2s
#168	MiniMax M2.7 medium	Minimax	2	5.0	$0.163	5/22	41.3s
Tests totaux 22 Tests incorrects 17 Coût total $0.163 Temps de réponse (moy.) 41.3s
#186	MiniMax M2.5 medium	Minimax	2	4.6	$0.340	5/22	68.3s
Tests totaux 22 Tests incorrects 17 Coût total $0.340 Temps de réponse (moy.) 68.3s
#194	Laguna Xs.2 medium	Poolside	2	4.1	$0.015	6/19	6.73s
Tests totaux 19 Tests incorrects 13 Coût total $0.015 Temps de réponse (moy.) 6.73s
#200	Qwen3.5-9B medium	Qwen	2	3.8	$0.036	3/22	82.2s
Tests totaux 22 Tests incorrects 19 Coût total $0.036 Temps de réponse (moy.) 82.2s

1 2 3 4 5

→

Échecs Aucune réponse

Filtrer les modèles

Meilleurs modèles par Nombre de Aucune réponse

Nombre de Aucune réponse vs Score

Meilleurs modèles par Temps de réponse (moy.)