Classement des échecs pour Aucune réponse

Voyez quels modèles d'IA rencontrent le plus souvent Aucune réponse, pour repérer les risques de fiabilité avant de choisir. Trier par: Tests corrects ↑.

Modèles affichés

Échecs totaux

Modèle le plus touché

Qwen3.5-9B 2

Catégories

Dans la catégorie Combiné29 Dans la catégorie Programmation18 Dans la catégorie Culture générale13 Dans la catégorie Analyse et extraction des données8 Dans la catégorie Spécifique au domaine8 Dans la catégorie Astuces anti-IA4 Dans la catégorie Résolution d'énigmes3 Dans la catégorie Appel d'outils2 Dans la catégorie Suivi des instructions2

67/67

Rang	Modèle	Entreprise	Nombre de Aucune réponse	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#204	Qwen3.5-9B medium	Qwen	2	3.8	$0.036	3/22	82.2s
Tests totaux 22 Tests incorrects 19 Coût total $0.036 Temps de réponse (moy.) 82.2s
#161	Qwen3.6 35B A3B none	Qwen	1	5.3	$0.061	4/22	5.52s
Tests totaux 22 Tests incorrects 18 Coût total $0.061 Temps de réponse (moy.) 5.52s
#180	GPT-5.4 Nano none	OpenAI	1	4.8	$0.041	4/22	2.57s
Tests totaux 22 Tests incorrects 18 Coût total $0.041 Temps de réponse (moy.) 2.57s
#187	Qwen3 Coder Next medium	Qwen	1	4.7	$0.032	4/22	9.61s
Tests totaux 22 Tests incorrects 18 Coût total $0.032 Temps de réponse (moy.) 9.61s
#194	GLM 4.7 Flash medium	Z.ai	3	4.3	$0.166	4/22	142.6s
Tests totaux 22 Tests incorrects 18 Coût total $0.166 Temps de réponse (moy.) 142.6s
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	3.4	$0.000	4/19	17.1s
Tests totaux 19 Tests incorrects 15 Coût total $0.000 Temps de réponse (moy.) 17.1s
#166	Qwen3 Coder Next none	Qwen	1	5.1	$0.025	5/22	9.12s
Tests totaux 22 Tests incorrects 17 Coût total $0.025 Temps de réponse (moy.) 9.12s
#167	Mistral Small 4 medium	Mistral	1	5.1	$0.096	5/22	10.8s
Tests totaux 22 Tests incorrects 17 Coût total $0.096 Temps de réponse (moy.) 10.8s
#168	MiMo-V2.5 none	Xiaomi	1	5.1	$0.025	5/22	4.62s
Tests totaux 22 Tests incorrects 17 Coût total $0.025 Temps de réponse (moy.) 4.62s
#172	MiniMax M2.7 medium	Minimax	2	5.0	$0.163	5/22	41.3s
Tests totaux 22 Tests incorrects 17 Coût total $0.163 Temps de réponse (moy.) 41.3s
#174	GPT-4o-mini none	OpenAI	1	5.0	$0.010	5/22	1.99s
Tests totaux 22 Tests incorrects 17 Coût total $0.010 Temps de réponse (moy.) 1.99s
#190	MiniMax M2.5 medium	Minimax	2	4.6	$0.340	5/22	68.3s
Tests totaux 22 Tests incorrects 17 Coût total $0.340 Temps de réponse (moy.) 68.3s
#154	MiMo-V2.5-Pro none	Xiaomi	1	5.5	$0.068	6/22	4.12s
Tests totaux 22 Tests incorrects 16 Coût total $0.068 Temps de réponse (moy.) 4.12s
#155	Kimi K2.5 none	Moonshot AI	1	5.5	$0.127	6/22	19.2s
Tests totaux 22 Tests incorrects 16 Coût total $0.127 Temps de réponse (moy.) 19.2s
#198	Laguna Xs.2 medium	Poolside	2	4.1	$0.015	6/19	6.73s
Tests totaux 19 Tests incorrects 13 Coût total $0.015 Temps de réponse (moy.) 6.73s

1 2 3 4 5

→

Échecs Aucune réponse

Filtrer les modèles

Meilleurs modèles par Nombre de Aucune réponse

Nombre de Aucune réponse vs Score

Meilleurs modèles par Temps de réponse (moy.)