Classement des échecs pour Délai dépassé

Voyez quels modèles d'IA rencontrent le plus souvent Délai dépassé, pour repérer les risques de fiabilité avant de choisir. Trier par: Tests corrects ↑.

Modèles affichés

Échecs totaux

Modèle le plus touché

Qwen3.5-9B 12

Catégories

Dans la catégorie Spécifique au domaine43 Dans la catégorie Programmation26 Dans la catégorie Combiné5 Dans la catégorie Résolution d'énigmes5 Dans la catégorie Astuces anti-IA4 Dans la catégorie Intelligence générale4 Dans la catégorie Analyse et extraction des données1 Dans la catégorie Suivi des instructions1

44/44

Rang	Modèle	Entreprise	Nombre de Délai dépassé	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#80	DeepSeek V3.2 medium	DeepSeek	2	7.0	$0.078	11/22	68.6s
Tests totaux 22 Tests incorrects 11 Coût total $0.078 Temps de réponse (moy.) 68.6s
#84	Seed-2.0-Mini medium	Bytedance Seed	5	7.0	$0.101	11/22	92.5s
Tests totaux 22 Tests incorrects 11 Coût total $0.101 Temps de réponse (moy.) 92.5s
#125	Qwen3.5-35B-A3B medium	Qwen	5	6.2	$0.837	11/22	112.5s
Tests totaux 22 Tests incorrects 11 Coût total $0.837 Temps de réponse (moy.) 112.5s
#136	Step 3.5 Flash medium	Stepfun	1	6.0	$0.108	11/21	174.2s
Tests totaux 21 Tests incorrects 10 Coût total $0.108 Temps de réponse (moy.) 174.2s
#29	GPT-5 Mini medium	OpenAI	1	8.1	$0.237	12/22	27.6s
Tests totaux 22 Tests incorrects 10 Coût total $0.237 Temps de réponse (moy.) 27.6s
#51	MiniMax M3 medium	Minimax	3	7.6	$0.286	12/22	75.0s
Tests totaux 22 Tests incorrects 10 Coût total $0.286 Temps de réponse (moy.) 75.0s
#56	Kimi K2.7 Code medium	Moonshot AI	3	7.5	$0.740	12/22	84.2s
Tests totaux 22 Tests incorrects 10 Coût total $0.740 Temps de réponse (moy.) 84.2s
#64	LongCat 2.0 medium	Meituan	1	7.4	$0.478	12/22	136.6s
Tests totaux 22 Tests incorrects 10 Coût total $0.478 Temps de réponse (moy.) 136.6s
#72	Kimi K2.6 medium	Moonshot AI	3	7.2	$1.036	12/22	110.0s
Tests totaux 22 Tests incorrects 10 Coût total $1.036 Temps de réponse (moy.) 110.0s
#120	Qwen3.5-Flash medium	Qwen	3	6.2	$0.139	12/22	84.8s
Tests totaux 22 Tests incorrects 10 Coût total $0.139 Temps de réponse (moy.) 84.8s
#115	Mimo V2 PRO medium	Xiaomi	1	6.3	$0.333	12/21	22.2s
Tests totaux 21 Tests incorrects 9 Coût total $0.333 Temps de réponse (moy.) 22.2s
#119	MiMo-V2-Flash medium	Xiaomi	1	6.3	$0.043	12/21	20.1s
Tests totaux 21 Tests incorrects 9 Coût total $0.043 Temps de réponse (moy.) 20.1s
#62	Qwen3.5-27B medium	Qwen	1	7.4	$1.627	13/22	111.9s
Tests totaux 22 Tests incorrects 9 Coût total $1.627 Temps de réponse (moy.) 111.9s
#74	Qwen3.5 Plus 2026-04-20 medium	Qwen	1	7.2	$0.317	13/22	46.4s
Tests totaux 22 Tests incorrects 9 Coût total $0.317 Temps de réponse (moy.) 46.4s
#78	GLM 5.1 medium	Z.ai	2	7.1	$0.535	13/22	46.8s
Tests totaux 22 Tests incorrects 9 Coût total $0.535 Temps de réponse (moy.) 46.8s

Échecs Délai dépassé

Filtrer les modèles

Meilleurs modèles par Nombre de Délai dépassé

Nombre de Délai dépassé vs Score

Meilleurs modèles par Temps de réponse (moy.)