Classement des échecs pour Aucune réponse

Voyez quels modèles d'IA rencontrent le plus souvent Aucune réponse, pour repérer les risques de fiabilité avant de choisir. Trier par: Temps de réponse (moy.) ↑.

Modèles affichés

Échecs totaux

Modèle le plus touché

Gemini 3.1 Flash Lite Preview 1

Catégories

Dans la catégorie Combiné29 Dans la catégorie Programmation18 Dans la catégorie Culture générale13 Dans la catégorie Analyse et extraction des données8 Dans la catégorie Spécifique au domaine8 Dans la catégorie Astuces anti-IA4 Dans la catégorie Résolution d'énigmes3 Dans la catégorie Appel d'outils2 Dans la catégorie Suivi des instructions2

67/67

Rang	Modèle	Entreprise	Nombre de Aucune réponse	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#106	Gemini 3.1 Flash Lite Preview none	Google	1	6.4	$0.052	12/22	1.58s
Tests totaux 22 Tests incorrects 10 Coût total $0.052 Temps de réponse (moy.) 1.58s
#132	GPT-5.6 Terra none	OpenAI	1	6.0	$0.349	8/22	1.65s
Tests totaux 22 Tests incorrects 14 Coût total $0.349 Temps de réponse (moy.) 1.65s
#122	Gemini 3.1 Flash Lite none	Google	1	6.1	$0.046	9/22	1.75s
Tests totaux 22 Tests incorrects 13 Coût total $0.046 Temps de réponse (moy.) 1.75s
#120	Gemini 3.1 Flash Lite minimal	Google	1	6.1	$0.047	10/22	1.86s
Tests totaux 22 Tests incorrects 12 Coût total $0.047 Temps de réponse (moy.) 1.86s
#174	GPT-4o-mini none	OpenAI	1	5.0	$0.010	5/22	1.99s
Tests totaux 22 Tests incorrects 17 Coût total $0.010 Temps de réponse (moy.) 1.99s
#180	GPT-5.4 Nano none	OpenAI	1	4.8	$0.041	4/22	2.57s
Tests totaux 22 Tests incorrects 18 Coût total $0.041 Temps de réponse (moy.) 2.57s
#89	Gemini 3 Flash Preview none	Google	1	6.8	$0.085	13/22	2.95s
Tests totaux 22 Tests incorrects 9 Coût total $0.085 Temps de réponse (moy.) 2.95s
#154	MiMo-V2.5-Pro none	Xiaomi	1	5.5	$0.068	6/22	4.12s
Tests totaux 22 Tests incorrects 16 Coût total $0.068 Temps de réponse (moy.) 4.12s
#116	Seed-2.0-Lite none	Bytedance Seed	1	6.2	$0.066	8/22	4.40s
Tests totaux 22 Tests incorrects 14 Coût total $0.066 Temps de réponse (moy.) 4.40s
#168	MiMo-V2.5 none	Xiaomi	1	5.1	$0.025	5/22	4.62s
Tests totaux 22 Tests incorrects 17 Coût total $0.025 Temps de réponse (moy.) 4.62s
#66	Claude Opus 4.8 none	Anthropic	1	7.3	$1.166	13/22	4.91s
Tests totaux 22 Tests incorrects 9 Coût total $1.166 Temps de réponse (moy.) 4.91s
#161	Qwen3.6 35B A3B none	Qwen	1	5.3	$0.061	4/22	5.52s
Tests totaux 22 Tests incorrects 18 Coût total $0.061 Temps de réponse (moy.) 5.52s
#112	Claude Sonnet 5 none	Anthropic	2	6.3	$0.548	8/22	6.04s
Tests totaux 22 Tests incorrects 14 Coût total $0.548 Temps de réponse (moy.) 6.04s
#151	GLM 5.1 none	Z.ai	1	5.5	$0.164	7/22	6.70s
Tests totaux 22 Tests incorrects 15 Coût total $0.164 Temps de réponse (moy.) 6.70s
#198	Laguna Xs.2 medium	Poolside	2	4.1	$0.015	6/19	6.73s
Tests totaux 19 Tests incorrects 13 Coût total $0.015 Temps de réponse (moy.) 6.73s

1 2 3 4 5

→

Échecs Aucune réponse

Filtrer les modèles

Meilleurs modèles par Nombre de Aucune réponse

Nombre de Aucune réponse vs Score

Meilleurs modèles par Temps de réponse (moy.)