Classement Astuces anti-IA x Mauvaise réponse

Voyez quels modèles d'IA ont le plus de chances de rencontrer Mauvaise réponse sur Astuces anti-IA, pour repérer plus vite les points faibles. Trier par: Nombre d'échecs ↑.

Modèles affichés

Échecs totaux

293

Modèle le plus touché

GPT-5.6 Sol 1

Raisons d'échec

Mauvaise réponse293 N'a pas suivi les instructions33 Mise en forme supplémentaire20 Erreur API14 Aucune réponse4 Délai dépassé4

Catégories

Spécifique au domaine412 Astuces anti-IA293 Programmation252 Résolution d'énigmes201 Culture générale168 Combiné68 Suivi des instructions61 Intelligence générale59 Analyse et extraction des données41 Appel d'outils3

140/140

Rang	Modèle	Entreprise	Nombre de Mauvaise réponse	Score de catégorie	Coût total	Tests corrects	Temps de réponse (moy.)
#3	GPT-5.6 Sol low	OpenAI	1	8.3	$0.971	3/4	2.60s
Tests totaux 4 Tests incorrects 1 Coût total $0.971 Temps de réponse (moy.) 2.60s
#5	GPT-5.6 Sol high	OpenAI	1	8.7	$1.234	3/4	3.39s
Tests totaux 4 Tests incorrects 1 Coût total $1.234 Temps de réponse (moy.) 3.39s
#13	GPT-5.3-Codex medium	OpenAI	1	8.7	$0.920	3/4	4.16s
Tests totaux 4 Tests incorrects 1 Coût total $0.920 Temps de réponse (moy.) 4.16s
#15	Claude Opus 4.7 medium	Anthropic	1	8.3	$1.477	3/4	1.85s
Tests totaux 4 Tests incorrects 1 Coût total $1.477 Temps de réponse (moy.) 1.85s
#18	GPT-5.4 medium	OpenAI	1	8.3	$1.533	3/4	4.11s
Tests totaux 4 Tests incorrects 1 Coût total $1.533 Temps de réponse (moy.) 4.11s
#21	GPT-5.2 medium	OpenAI	1	6.5	$0.951	2/4	7.81s
Tests totaux 4 Tests incorrects 2 Coût total $0.951 Temps de réponse (moy.) 7.81s
#25	Gemini 2.5 Flash medium	Google	1	8.4	$0.643	3/4	6.30s
Tests totaux 4 Tests incorrects 1 Coût total $0.643 Temps de réponse (moy.) 6.30s
#26	GPT-5 Mini medium	OpenAI	1	7.1	$0.237	2/4	13.9s
Tests totaux 4 Tests incorrects 2 Coût total $0.237 Temps de réponse (moy.) 13.9s
#27	Muse Spark 1.1 high	Meta	1	7.5	$1.694	2/4	8.60s
Tests totaux 4 Tests incorrects 2 Coût total $1.694 Temps de réponse (moy.) 8.60s
#30	GPT-5.2 Chat none	OpenAI	1	8.7	$0.604	3/4	3.40s
Tests totaux 4 Tests incorrects 1 Coût total $0.604 Temps de réponse (moy.) 3.40s
#34	GPT-5.6 Terra high	OpenAI	1	8.3	$1.055	3/4	2.54s
Tests totaux 4 Tests incorrects 1 Coût total $1.055 Temps de réponse (moy.) 2.54s
#35	Seed-2.0-Lite medium	Bytedance Seed	1	8.3	$0.234	3/4	18.0s
Tests totaux 4 Tests incorrects 1 Coût total $0.234 Temps de réponse (moy.) 18.0s
#39	GPT-5.6 Terra medium	OpenAI	1	8.3	$0.676	3/4	2.22s
Tests totaux 4 Tests incorrects 1 Coût total $0.676 Temps de réponse (moy.) 2.22s
#40	Claude Sonnet 4.6 medium	Anthropic	1	6.5	$2.057	2/4	2.98s
Tests totaux 4 Tests incorrects 2 Coût total $2.057 Temps de réponse (moy.) 2.98s
#44	GPT-5.6 Luna high	OpenAI	1	8.3	$1.017	3/4	2.99s
Tests totaux 4 Tests incorrects 1 Coût total $1.017 Temps de réponse (moy.) 2.99s

Filtrer les modèles

Meilleurs modèles par Nombre de Mauvaise réponse

Nombre de Mauvaise réponse vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé

Astuces anti-IA : Mauvaise réponse

Filtrer les modèles

Meilleurs modèles par Nombre de Mauvaise réponse

Nombre de Mauvaise réponse vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé