Classement des modèles pour Résolution d'énigmes

Voyez quels modèles d'IA réussissent le mieux sur Résolution d'énigmes, lesquels restent fiables et où les écarts sont les plus marqués.

Modèles affichés

Moyenne de Score Résolution d'énigmes

6.7

Meilleur modèle

Gemini 3 Flash Preview 10.0

Raisons d'échec

Avec la raison d'échec Mauvaise réponse201 Avec la raison d'échec N'a pas suivi les instructions90 Avec la raison d'échec Erreur API12 Avec la raison d'échec Mise en forme supplémentaire8 Avec la raison d'échec Délai dépassé5 Avec la raison d'échec Aucune réponse3

210/210

Rang	Modèle	Entreprise	Score Résolution d'énigmes	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#33	Kimi K3 max	Moonshot AI	10.0	8.0	$3.112	3/3	7.36s
Tests totaux 3 Tests incorrects 0 Coût total $3.112 Temps de réponse (moy.) 7.36s
#36	Qwen3.7 Plus medium	Qwen	10.0	7.9	$0.267	3/3	16.4s
Tests totaux 3 Tests incorrects 0 Coût total $0.267 Temps de réponse (moy.) 16.4s
#37	Qwen3.6 Plus medium	Qwen	10.0	7.8	$0.405	3/3	6.34s
Tests totaux 3 Tests incorrects 0 Coût total $0.405 Temps de réponse (moy.) 6.34s
#40	Claude Sonnet 4.6 medium	Anthropic	10.0	7.8	$2.057	3/3	5.31s
Tests totaux 3 Tests incorrects 0 Coût total $2.057 Temps de réponse (moy.) 5.31s
#41	Claude Opus 4.8 low	Anthropic	10.0	7.8	$2.077	3/3	3.01s
Tests totaux 3 Tests incorrects 0 Coût total $2.077 Temps de réponse (moy.) 3.01s
#42	GLM 5 medium	Z.ai	10.0	7.7	$0.307	3/3	11.3s
Tests totaux 3 Tests incorrects 0 Coût total $0.307 Temps de réponse (moy.) 11.3s
#54	GPT-5.3 Chat none	OpenAI	10.0	7.5	$0.571	3/3	2.99s
Tests totaux 3 Tests incorrects 0 Coût total $0.571 Temps de réponse (moy.) 2.99s
#55	GPT-5.6 Terra low	OpenAI	10.0	7.5	$0.519	3/3	4.46s
Tests totaux 3 Tests incorrects 0 Coût total $0.519 Temps de réponse (moy.) 4.46s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	10.0	7.5	$0.437	3/3	32.5s
Tests totaux 3 Tests incorrects 0 Coût total $0.437 Temps de réponse (moy.) 32.5s
#59	Qwen3.7 Max none	Qwen	10.0	7.4	$0.197	3/3	1.13s
Tests totaux 3 Tests incorrects 0 Coût total $0.197 Temps de réponse (moy.) 1.13s
#61	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.177	3/3	5.77s
Tests totaux 3 Tests incorrects 0 Coût total $0.177 Temps de réponse (moy.) 5.77s
#72	Qwen3.5-122B-A10B medium	Qwen	10.0	7.1	$1.046	3/3	17.9s
Tests totaux 3 Tests incorrects 0 Coût total $1.046 Temps de réponse (moy.) 17.9s
#79	Gemini 3.5 Flash none	Google	10.0	7.0	$1.079	3/3	3.13s
Tests totaux 3 Tests incorrects 0 Coût total $1.079 Temps de réponse (moy.) 3.13s
#82	DeepSeek V4 Pro none	DeepSeek	10.0	6.9	$0.096	3/3	3.61s
Tests totaux 3 Tests incorrects 0 Coût total $0.096 Temps de réponse (moy.) 3.61s
#88	Gemini 3.5 Flash minimal	Google	10.0	6.8	$0.300	3/3	1.45s
Tests totaux 3 Tests incorrects 0 Coût total $0.300 Temps de réponse (moy.) 1.45s

Classement Résolution d'énigmes

Filtrer les modèles

Meilleurs modèles par Score Résolution d'énigmes

Score Résolution d'énigmes vs coût total

Meilleurs modèles par Temps de réponse (moy.)