Classement Astuces anti-IA x Mauvaise réponse

Voyez quels modèles d'IA ont le plus de chances de rencontrer Mauvaise réponse sur Astuces anti-IA, pour repérer plus vite les points faibles.

Modèles affichés

Échecs totaux

293

Modèle le plus touché

Seed-2.0-Lite 4

Raisons d'échec

Mauvaise réponse293 N'a pas suivi les instructions33 Mise en forme supplémentaire20 Erreur API14 Aucune réponse4 Délai dépassé4

Catégories

Spécifique au domaine421 Astuces anti-IA293 Programmation259 Résolution d'énigmes204 Culture générale172 Combiné69 Intelligence générale62 Suivi des instructions61 Analyse et extraction des données41 Appel d'outils3

140/140

Rang	Modèle	Entreprise	Nombre de Mauvaise réponse	Score de catégorie	Coût total	Tests corrects	Temps de réponse (moy.)
#44	Claude Sonnet 4.6 medium	Anthropic	1	6.5	$2.057	2/4	2.98s
Tests totaux 4 Tests incorrects 2 Coût total $2.057 Temps de réponse (moy.) 2.98s
#48	GPT-5.6 Luna high	OpenAI	1	8.3	$1.017	3/4	2.99s
Tests totaux 4 Tests incorrects 1 Coût total $1.017 Temps de réponse (moy.) 2.99s
#49	DeepSeek V4 Flash high	DeepSeek	1	8.3	$0.041	3/4	28.5s
Tests totaux 4 Tests incorrects 1 Coût total $0.041 Temps de réponse (moy.) 28.5s
#54	GPT-5.6 Luna medium	OpenAI	1	8.3	$0.352	3/4	2.52s
Tests totaux 4 Tests incorrects 1 Coût total $0.352 Temps de réponse (moy.) 2.52s
#57	GPT-5.4 Nano medium	OpenAI	1	8.3	$0.138	3/4	4.52s
Tests totaux 4 Tests incorrects 1 Coût total $0.138 Temps de réponse (moy.) 4.52s
#58	GPT-5.3 Chat none	OpenAI	1	6.7	$0.571	2/4	3.86s
Tests totaux 4 Tests incorrects 2 Coût total $0.571 Temps de réponse (moy.) 3.86s
#59	GPT-5.6 Terra low	OpenAI	1	8.3	$0.519	3/4	2.36s
Tests totaux 4 Tests incorrects 1 Coût total $0.519 Temps de réponse (moy.) 2.36s
#60	GPT-5.4 Mini medium	OpenAI	1	8.6	$0.756	3/4	4.05s
Tests totaux 4 Tests incorrects 1 Coût total $0.756 Temps de réponse (moy.) 4.05s
#61	Qwen3.5 Plus 2026-02-15 medium	Qwen	1	8.2	$0.437	3/4	45.8s
Tests totaux 4 Tests incorrects 1 Coût total $0.437 Temps de réponse (moy.) 45.8s
#67	Claude Sonnet 4.6 none	Anthropic	1	4.8	$0.661	1/4	2.94s
Tests totaux 4 Tests incorrects 3 Coût total $0.661 Temps de réponse (moy.) 2.94s
#71	Step 3.7 Flash low	Stepfun	1	8.7	$0.454	3/4	4.02s
Tests totaux 4 Tests incorrects 1 Coût total $0.454 Temps de réponse (moy.) 4.02s
#72	Kimi K2.6 medium	Moonshot AI	1	7.0	$1.036	2/4	11.6s
Tests totaux 4 Tests incorrects 2 Coût total $1.036 Temps de réponse (moy.) 11.6s
#79	Grok 4.20 medium	X AI	1	8.2	$0.777	3/4	3.95s
Tests totaux 4 Tests incorrects 1 Coût total $0.777 Temps de réponse (moy.) 3.95s
#81	Kimi K2.5 medium	Moonshot AI	1	7.3	$0.600	2/4	51.4s
Tests totaux 4 Tests incorrects 2 Coût total $0.600 Temps de réponse (moy.) 51.4s
#82	Mercury 2 medium	Inception	1	6.9	$0.093	2/4	1.12s
Tests totaux 4 Tests incorrects 2 Coût total $0.093 Temps de réponse (moy.) 1.12s

Filtrer les modèles

Meilleurs modèles par Nombre de Mauvaise réponse

Nombre de Mauvaise réponse vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé

Astuces anti-IA : Mauvaise réponse

Filtrer les modèles

Meilleurs modèles par Nombre de Mauvaise réponse

Nombre de Mauvaise réponse vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé