Classement des échecs pour Délai dépassé

Voyez quels modèles d'IA rencontrent le plus souvent Délai dépassé, pour repérer les risques de fiabilité avant de choisir. Trier par: Nombre d'échecs ↑.

Modèles affichés

Échecs totaux

Modèle le plus touché

Claude Opus 4.7 1

Catégories

Dans la catégorie Spécifique au domaine43 Dans la catégorie Programmation26 Dans la catégorie Combiné5 Dans la catégorie Résolution d'énigmes5 Dans la catégorie Astuces anti-IA4 Dans la catégorie Intelligence générale4 Dans la catégorie Analyse et extraction des données1 Dans la catégorie Suivi des instructions1

44/44

Rang	Modèle	Entreprise	Nombre de Délai dépassé	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#15	Claude Opus 4.7 medium	Anthropic	1	8.7	$1.477	18/22	7.61s
Tests totaux 22 Tests incorrects 4 Coût total $1.477 Temps de réponse (moy.) 7.61s
#19	Qwen3.6 Max Preview medium	Qwen	1	8.4	$1.143	16/22	67.5s
Tests totaux 22 Tests incorrects 6 Coût total $1.143 Temps de réponse (moy.) 67.5s
#21	GPT-5.2 medium	OpenAI	1	8.4	$0.951	14/22	22.6s
Tests totaux 22 Tests incorrects 8 Coût total $0.951 Temps de réponse (moy.) 22.6s
#26	GPT-5 Mini medium	OpenAI	1	8.1	$0.237	12/22	27.6s
Tests totaux 22 Tests incorrects 10 Coût total $0.237 Temps de réponse (moy.) 27.6s
#36	Qwen3.7 Plus medium	Qwen	1	7.9	$0.267	15/22	51.5s
Tests totaux 22 Tests incorrects 7 Coût total $0.267 Temps de réponse (moy.) 51.5s
#38	GLM 5.2 medium	Z.ai	1	7.8	$0.222	15/21	23.3s
Tests totaux 21 Tests incorrects 6 Coût total $0.222 Temps de réponse (moy.) 23.3s
#40	Claude Sonnet 4.6 medium	Anthropic	1	7.8	$2.057	14/22	25.9s
Tests totaux 22 Tests incorrects 8 Coût total $2.057 Temps de réponse (moy.) 25.9s
#42	GLM 5 medium	Z.ai	1	7.7	$0.307	15/21	33.5s
Tests totaux 21 Tests incorrects 6 Coût total $0.307 Temps de réponse (moy.) 33.5s
#46	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
Tests totaux 22 Tests incorrects 12 Coût total $0.200 Temps de réponse (moy.) 79.1s
#49	GLM 5 Turbo medium	Z.ai	1	7.6	$0.323	14/21	23.0s
Tests totaux 21 Tests incorrects 7 Coût total $0.323 Temps de réponse (moy.) 23.0s
#58	Qwen3.5-27B medium	Qwen	1	7.4	$1.627	13/22	111.9s
Tests totaux 22 Tests incorrects 9 Coût total $1.627 Temps de réponse (moy.) 111.9s
#60	LongCat 2.0 medium	Meituan	1	7.4	$0.478	12/22	136.6s
Tests totaux 22 Tests incorrects 10 Coût total $0.478 Temps de réponse (moy.) 136.6s
#70	Qwen3.5 Plus 2026-04-20 medium	Qwen	1	7.2	$0.317	13/22	46.4s
Tests totaux 22 Tests incorrects 9 Coût total $0.317 Temps de réponse (moy.) 46.4s
#91	LongCat 2.0 low	Meituan	1	6.7	$0.391	10/22	100.3s
Tests totaux 22 Tests incorrects 12 Coût total $0.391 Temps de réponse (moy.) 100.3s
#109	Mimo V2 PRO medium	Xiaomi	1	6.3	$0.333	12/21	22.2s
Tests totaux 21 Tests incorrects 9 Coût total $0.333 Temps de réponse (moy.) 22.2s

Échecs Délai dépassé

Filtrer les modèles

Meilleurs modèles par Nombre de Délai dépassé

Nombre de Délai dépassé vs Score

Meilleurs modèles par Temps de réponse (moy.)