Classement des modèles pour Résolution d'énigmes

Voyez quels modèles d'IA réussissent le mieux sur Résolution d'énigmes, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Temps de réponse (moy.) ↓.

Modèles affichés

Moyenne de Score Résolution d'énigmes

6.7

Meilleur modèle

Muse Spark 1.1 7.8

Raisons d'échec

Avec la raison d'échec Mauvaise réponse204 Avec la raison d'échec N'a pas suivi les instructions90 Avec la raison d'échec Erreur API12 Avec la raison d'échec Mise en forme supplémentaire8 Avec la raison d'échec Délai dépassé5 Avec la raison d'échec Aucune réponse3

216/216

Rang	Modèle	Entreprise	Score Résolution d'énigmes	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#115	Mimo V2 PRO medium	Xiaomi	6.4	6.3	$0.333	1/3	5.08s
Tests totaux 3 Tests incorrects 2 Coût total $0.333 Temps de réponse (moy.) 5.08s
#16	GPT-5.3-Codex medium	OpenAI	9.0	8.9	$0.920	2/3	5.05s
Tests totaux 3 Tests incorrects 1 Coût total $0.920 Temps de réponse (moy.) 5.05s
#9	GPT-5.5 low	OpenAI	10.0	9.3	$1.253	3/3	4.74s
Tests totaux 3 Tests incorrects 0 Coût total $1.253 Temps de réponse (moy.) 4.74s
#47	Claude Opus 4.6 medium	Anthropic	7.7	7.7	$3.059	2/3	4.71s
Tests totaux 3 Tests incorrects 1 Coût total $3.059 Temps de réponse (moy.) 4.71s
#205	Hy3 preview none	Tencent	3.1	4.0	$0.003	0/3	4.56s
Tests totaux 3 Tests incorrects 3 Coût total $0.003 Temps de réponse (moy.) 4.56s
#59	GPT-5.6 Terra low	OpenAI	10.0	7.5	$0.519	3/3	4.46s
Tests totaux 3 Tests incorrects 0 Coût total $0.519 Temps de réponse (moy.) 4.46s
#60	GPT-5.4 Mini medium	OpenAI	7.8	7.5	$0.756	2/3	4.37s
Tests totaux 3 Tests incorrects 1 Coût total $0.756 Temps de réponse (moy.) 4.37s
#121	Gemma 4 31B none	Google	6.5	6.2	$0.021	1/3	4.23s
Tests totaux 3 Tests incorrects 2 Coût total $0.021 Temps de réponse (moy.) 4.23s
#154	Owl Alpha none	Openrouter	5.4	5.6	$0.000	1/3	4.18s
Tests totaux 3 Tests incorrects 2 Coût total $0.000 Temps de réponse (moy.) 4.18s
#34	GPT-5.2 Chat none	OpenAI	7.7	8.0	$0.604	2/3	4.10s
Tests totaux 3 Tests incorrects 1 Coût total $0.604 Temps de réponse (moy.) 4.10s
#8	GPT-5.6 Sol high	OpenAI	10.0	9.4	$1.234	3/3	4.10s
Tests totaux 3 Tests incorrects 0 Coût total $1.234 Temps de réponse (moy.) 4.10s
#3	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	3/3	4.05s
Tests totaux 3 Tests incorrects 0 Coût total $0.742 Temps de réponse (moy.) 4.05s
#54	GPT-5.6 Luna medium	OpenAI	7.8	7.6	$0.352	2/3	4.04s
Tests totaux 3 Tests incorrects 1 Coût total $0.352 Temps de réponse (moy.) 4.04s
#161	Kimi K2.5 none	Moonshot AI	3.0	5.5	$0.127	0/3	4.04s
Tests totaux 3 Tests incorrects 3 Coût total $0.127 Temps de réponse (moy.) 4.04s
#17	Claude Opus 4.8 medium	Anthropic	10.0	8.8	$1.931	3/3	3.95s
Tests totaux 3 Tests incorrects 0 Coût total $1.931 Temps de réponse (moy.) 3.95s

Classement Résolution d'énigmes

Filtrer les modèles

Meilleurs modèles par Score Résolution d'énigmes

Score Résolution d'énigmes vs coût total

Meilleurs modèles par Temps de réponse (moy.)