Classement des modèles pour Résolution d'énigmes

Voyez quels modèles d'IA réussissent le mieux sur Résolution d'énigmes, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Temps de réponse (moy.) ↑.

Modèles affichés

Moyenne de Score Résolution d'énigmes

6.7

Meilleur modèle

Step 3.5 Flash 0.0

Raisons d'échec

Avec la raison d'échec Mauvaise réponse204 Avec la raison d'échec N'a pas suivi les instructions90 Avec la raison d'échec Erreur API12 Avec la raison d'échec Mise en forme supplémentaire8 Avec la raison d'échec Délai dépassé5 Avec la raison d'échec Aucune réponse3

216/216

Rang	Modèle	Entreprise	Score Résolution d'énigmes	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#67	Claude Sonnet 4.6 none	Anthropic	7.7	7.3	$0.661	2/3	2.53s
Tests totaux 3 Tests incorrects 1 Coût total $0.661 Temps de réponse (moy.) 2.53s
#103	Qwen3.6 Max Preview none	Qwen	10.0	6.6	$0.231	3/3	2.65s
Tests totaux 3 Tests incorrects 0 Coût total $0.231 Temps de réponse (moy.) 2.65s
#176	GLM 5 Turbo none	Z.ai	5.5	5.1	$0.047	1/3	2.65s
Tests totaux 3 Tests incorrects 2 Coût total $0.047 Temps de réponse (moy.) 2.65s
#113	Qwen3.5 Plus 2026-02-15 none	Qwen	7.7	6.4	$0.073	2/3	2.71s
Tests totaux 3 Tests incorrects 1 Coût total $0.073 Temps de réponse (moy.) 2.71s
#117	LongCat 2.0 none	Meituan	4.0	6.3	$0.044	0/3	2.74s
Tests totaux 3 Tests incorrects 3 Coût total $0.044 Temps de réponse (moy.) 2.74s
#70	Claude Opus 4.8 none	Anthropic	7.7	7.3	$1.166	2/3	2.74s
Tests totaux 3 Tests incorrects 1 Coût total $1.166 Temps de réponse (moy.) 2.74s
#122	Seed-2.0-Lite none	Bytedance Seed	5.3	6.2	$0.066	1/3	2.78s
Tests totaux 3 Tests incorrects 2 Coût total $0.066 Temps de réponse (moy.) 2.78s
#129	Inkling low	Thinkingmachines	6.4	6.1	$0.187	1/3	2.97s
Tests totaux 3 Tests incorrects 2 Coût total $0.187 Temps de réponse (moy.) 2.97s
#26	Claude Sonnet 5 medium	Anthropic	7.7	8.3	$0.922	2/3	2.98s
Tests totaux 3 Tests incorrects 1 Coût total $0.922 Temps de réponse (moy.) 2.98s
#7	GPT-5.6 Sol medium	OpenAI	8.2	9.4	$1.316	2/3	2.98s
Tests totaux 3 Tests incorrects 1 Coût total $1.316 Temps de réponse (moy.) 2.98s
#58	GPT-5.3 Chat none	OpenAI	10.0	7.5	$0.571	3/3	2.99s
Tests totaux 3 Tests incorrects 0 Coût total $0.571 Temps de réponse (moy.) 2.99s
#45	Claude Opus 4.8 low	Anthropic	10.0	7.8	$2.077	3/3	3.01s
Tests totaux 3 Tests incorrects 0 Coût total $2.077 Temps de réponse (moy.) 3.01s
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	8.2	6.7	$0.476	2/3	3.03s
Tests totaux 3 Tests incorrects 1 Coût total $0.476 Temps de réponse (moy.) 3.03s
#2	Gemini 3.6 Flash high	Google	10.0	9.7	$1.785	3/3	3.04s
Tests totaux 3 Tests incorrects 0 Coût total $1.785 Temps de réponse (moy.) 3.04s
#66	KAT-Coder-Pro V2.5 low	Kwaipilot	6.4	7.4	$0.387	1/3	3.11s
Tests totaux 3 Tests incorrects 2 Coût total $0.387 Temps de réponse (moy.) 3.11s

Classement Résolution d'énigmes

Filtrer les modèles

Meilleurs modèles par Score Résolution d'énigmes

Score Résolution d'énigmes vs coût total

Meilleurs modèles par Temps de réponse (moy.)