Classement des modèles pour Résolution d'énigmes

Voyez quels modèles d'IA réussissent le mieux sur Résolution d'énigmes, lesquels restent fiables et où les écarts sont les plus marqués.

Modèles affichés

Moyenne de Score Résolution d'énigmes

6.7

Meilleur modèle

Gemini 3.6 Flash 10.0

Raisons d'échec

Avec la raison d'échec Mauvaise réponse204 Avec la raison d'échec N'a pas suivi les instructions90 Avec la raison d'échec Erreur API12 Avec la raison d'échec Mise en forme supplémentaire8 Avec la raison d'échec Délai dépassé5 Avec la raison d'échec Aucune réponse3

216/216

Rang	Modèle	Entreprise	Score Résolution d'énigmes	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#28	Gemini 2.5 Flash medium	Google	7.7	8.2	$0.643	2/3	3.18s
Tests totaux 3 Tests incorrects 1 Coût total $0.643 Temps de réponse (moy.) 3.18s
#34	GPT-5.2 Chat none	OpenAI	7.7	8.0	$0.604	2/3	4.10s
Tests totaux 3 Tests incorrects 1 Coût total $0.604 Temps de réponse (moy.) 4.10s
#38	GPT-5.6 Terra high	OpenAI	7.7	8.0	$1.055	2/3	5.45s
Tests totaux 3 Tests incorrects 1 Coût total $1.055 Temps de réponse (moy.) 5.45s
#47	Claude Opus 4.6 medium	Anthropic	7.7	7.7	$3.059	2/3	4.71s
Tests totaux 3 Tests incorrects 1 Coût total $3.059 Temps de réponse (moy.) 4.71s
#52	Grok Build 0.1 medium	X AI	7.7	7.6	$1.097	2/3	18.3s
Tests totaux 3 Tests incorrects 1 Coût total $1.097 Temps de réponse (moy.) 18.3s
#67	Claude Sonnet 4.6 none	Anthropic	7.7	7.3	$0.661	2/3	2.53s
Tests totaux 3 Tests incorrects 1 Coût total $0.661 Temps de réponse (moy.) 2.53s
#68	Gemini 3.1 Flash Lite Preview medium	Google	7.7	7.3	$0.115	2/3	5.30s
Tests totaux 3 Tests incorrects 1 Coût total $0.115 Temps de réponse (moy.) 5.30s
#70	Claude Opus 4.8 none	Anthropic	7.7	7.3	$1.166	2/3	2.74s
Tests totaux 3 Tests incorrects 1 Coût total $1.166 Temps de réponse (moy.) 2.74s
#75	Qwen3.7 Plus none	Qwen	7.7	7.2	$0.106	2/3	1.71s
Tests totaux 3 Tests incorrects 1 Coût total $0.106 Temps de réponse (moy.) 1.71s
#79	Grok 4.20 medium	X AI	7.7	7.1	$0.777	2/3	6.22s
Tests totaux 3 Tests incorrects 1 Coût total $0.777 Temps de réponse (moy.) 6.22s
#87	GPT-5.6 Sol none	OpenAI	7.7	6.9	$0.524	2/3	1.49s
Tests totaux 3 Tests incorrects 1 Coût total $0.524 Temps de réponse (moy.) 1.49s
#91	GPT-5.5 none	OpenAI	7.7	6.9	$0.544	2/3	1.29s
Tests totaux 3 Tests incorrects 1 Coût total $0.544 Temps de réponse (moy.) 1.29s
#93	Gemini 3 Flash Preview none	Google	7.7	6.8	$0.085	2/3	1.05s
Tests totaux 3 Tests incorrects 1 Coût total $0.085 Temps de réponse (moy.) 1.05s
#98	GLM 5V Turbo medium	Z.ai	7.7	6.7	$0.457	2/3	10.2s
Tests totaux 3 Tests incorrects 1 Coût total $0.457 Temps de réponse (moy.) 10.2s
#101	GLM 5.2 none	Z.ai	7.7	6.6	$0.128	2/3	3.31s
Tests totaux 3 Tests incorrects 1 Coût total $0.128 Temps de réponse (moy.) 3.31s

Classement Résolution d'énigmes

Filtrer les modèles

Meilleurs modèles par Score Résolution d'énigmes

Score Résolution d'énigmes vs coût total

Meilleurs modèles par Temps de réponse (moy.)