Classement Astuces anti-IA x Mauvaise réponse

Voyez quels modèles d'IA ont le plus de chances de rencontrer Mauvaise réponse sur Astuces anti-IA, pour repérer plus vite les points faibles.

Modèles affichés

Échecs totaux

293

Modèle le plus touché

Seed-2.0-Lite 4

Raisons d'échec

Mauvaise réponse293 N'a pas suivi les instructions33 Mise en forme supplémentaire20 Erreur API14 Aucune réponse4 Délai dépassé4

Catégories

Spécifique au domaine421 Astuces anti-IA293 Programmation259 Résolution d'énigmes204 Culture générale172 Combiné69 Intelligence générale62 Suivi des instructions61 Analyse et extraction des données41 Appel d'outils3

140/140

Rang	Modèle	Entreprise	Nombre de Mauvaise réponse	Score de catégorie	Coût total	Tests corrects	Temps de réponse (moy.)
#91	GPT-5.5 none	OpenAI	2	6.9	$0.544	2/4	1.31s
Tests totaux 4 Tests incorrects 2 Coût total $0.544 Temps de réponse (moy.) 1.31s
#92	Gemini 3.5 Flash minimal	Google	2	6.5	$0.300	2/4	892ms
Tests totaux 4 Tests incorrects 2 Coût total $0.300 Temps de réponse (moy.) 892ms
#108	Laguna XS 2.1 medium	Poolside	2	4.8	$0.068	1/4	42.0s
Tests totaux 4 Tests incorrects 3 Coût total $0.068 Temps de réponse (moy.) 42.0s
#111	Gemini 3.1 Flash Lite low	Google	2	7.3	$0.621	2/4	1.84s
Tests totaux 4 Tests incorrects 2 Coût total $0.621 Temps de réponse (moy.) 1.84s
#121	Gemma 4 31B none	Google	2	6.5	$0.021	2/4	1.85s
Tests totaux 4 Tests incorrects 2 Coût total $0.021 Temps de réponse (moy.) 1.85s
#128	Gemini 3.1 Flash Lite none	Google	2	7.5	$0.046	2/4	1.07s
Tests totaux 4 Tests incorrects 2 Coût total $0.046 Temps de réponse (moy.) 1.07s
#134	GPT-5 Nano medium	OpenAI	2	6.5	$0.114	2/4	25.5s
Tests totaux 4 Tests incorrects 2 Coût total $0.114 Temps de réponse (moy.) 25.5s
#164	KAT-Coder-Air V2.5 low	Kwaipilot	2	7.3	$0.041	2/4	3.50s
Tests totaux 4 Tests incorrects 2 Coût total $0.041 Temps de réponse (moy.) 3.50s
#166	Laguna XS 2.1 none	Poolside	2	5.3	$0.008	1/4	755ms
Tests totaux 4 Tests incorrects 3 Coût total $0.008 Temps de réponse (moy.) 755ms
#172	Qwen3 Coder Next none	Qwen	2	3.6	$0.025	0/4	3.31s
Tests totaux 4 Tests incorrects 4 Coût total $0.025 Temps de réponse (moy.) 3.31s
#177	North Mini Code none	Cohere	2	3.0	$0.000	0/4	22.5s
Tests totaux 4 Tests incorrects 4 Coût total $0.000 Temps de réponse (moy.) 22.5s
#190	Hunter Alpha medium	OpenRouter	2	7.3	$0.000	2/4	4.75s
Tests totaux 4 Tests incorrects 2 Coût total $0.000 Temps de réponse (moy.) 4.75s
#200	GLM 4.7 Flash medium	Z.ai	2	4.7	$0.166	1/4	15.0s
Tests totaux 4 Tests incorrects 3 Coût total $0.166 Temps de réponse (moy.) 15.0s
#201	Elephant Alpha medium	Openrouter	2	6.6	$0.000	2/4	1.19s
Tests totaux 4 Tests incorrects 2 Coût total $0.000 Temps de réponse (moy.) 1.19s
#207	Granite 4.1 8B none	IBM Granite	2	4.9	$0.007	1/4	844ms
Tests totaux 4 Tests incorrects 3 Coût total $0.007 Temps de réponse (moy.) 844ms

Filtrer les modèles

Meilleurs modèles par Nombre de Mauvaise réponse

Nombre de Mauvaise réponse vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé

Astuces anti-IA : Mauvaise réponse

Filtrer les modèles

Meilleurs modèles par Nombre de Mauvaise réponse

Nombre de Mauvaise réponse vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé