Échecs par catégorie AI BENCHY

Analyse et extraction des données

Mauvaise réponse

Voyez quels modèles d'IA ont le plus de chances de rencontrer Mauvaise réponse sur Analyse et extraction des données, pour repérer plus vite les points faibles.

Modèles affichés

Échecs totaux

Modèle le plus touché

GPT-5 Nano 2

Raisons d'échec liées

Mauvaise réponse14 Erreur API4 Aucune réponse2 Mise en forme supplémentaire1

Catégories liées

Spécifique au domaine98 Résolution d'énigmes55 Astuces anti-IA53 Suivi des instructions26 Combiné21 Analyse et extraction des données14 Intelligence générale6 Appel d'outils2

Rang	Modèle	Entreprise	Nombre de Mauvaise réponse	Score de catégorie	Tests corrects	Temps de réponse (moy.)
#34	GPT-5 Nano medium	OpenAI	2	10.0	0/2	21.4s
#43	MiniMax M2.5 medium	Minimax	2	10.0	0/2	7.48s
#55	LFM2-24B-A2B none	Liquid	2	10.0	0/2	714ms
#33	DeepSeek V3.2 none	DeepSeek	1	5.4	1/2	9.42s
#36	Mercury 2 medium	Inception	1	5.5	1/2	1.11s
#39	gpt-oss-120b medium	OpenAI	1	5.5	1/2	1.98s
#46	Kimi K2.5 none	Moonshot AI	1	5.4	1/2	42.1s
#48	Qwen3 Coder Next none	Qwen	1	5.4	1/2	1.32s
#49	GLM 4.7 Flash none	Z.ai	1	5.4	1/2	4.82s
#50	Qwen3 Coder Next medium	Qwen	1	5.4	1/2	81.8s
#51	Mercury 2 none	Inception	1	5.5	1/2	667ms

Analyse et extraction des données

Mauvaise réponse

Meilleurs modèles par Nombre de Mauvaise réponse

Nombre de Mauvaise réponse vs score moyen

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé