Classement des modèles pour Résolution d'énigmes

Voyez quels modèles d'IA réussissent le mieux sur Résolution d'énigmes, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Tests corrects ↓.

Modèles affichés

Moyenne de Score Résolution d'énigmes

6.7

Meilleur modèle

Gemini 3.6 Flash 10.0

Raisons d'échec

Avec la raison d'échec Mauvaise réponse204 Avec la raison d'échec N'a pas suivi les instructions90 Avec la raison d'échec Erreur API12 Avec la raison d'échec Mise en forme supplémentaire8 Avec la raison d'échec Délai dépassé5 Avec la raison d'échec Aucune réponse3

216/216

Rang	Modèle	Entreprise	Score Résolution d'énigmes	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#74	Qwen3.5 Plus 2026-04-20 medium	Qwen	8.2	7.2	$0.317	2/3	17.7s
Tests totaux 3 Tests incorrects 1 Coût total $0.317 Temps de réponse (moy.) 17.7s
#75	Qwen3.7 Plus none	Qwen	7.7	7.2	$0.106	2/3	1.71s
Tests totaux 3 Tests incorrects 1 Coût total $0.106 Temps de réponse (moy.) 1.71s
#78	GLM 5.1 medium	Z.ai	8.2	7.1	$0.535	2/3	31.6s
Tests totaux 3 Tests incorrects 1 Coût total $0.535 Temps de réponse (moy.) 31.6s
#79	Grok 4.20 medium	X AI	7.7	7.1	$0.777	2/3	6.22s
Tests totaux 3 Tests incorrects 1 Coût total $0.777 Temps de réponse (moy.) 6.22s
#84	Seed-2.0-Mini medium	Bytedance Seed	8.2	7.0	$0.101	2/3	31.8s
Tests totaux 3 Tests incorrects 1 Coût total $0.101 Temps de réponse (moy.) 31.8s
#87	GPT-5.6 Sol none	OpenAI	7.7	6.9	$0.524	2/3	1.49s
Tests totaux 3 Tests incorrects 1 Coût total $0.524 Temps de réponse (moy.) 1.49s
#89	Qwen3.6 Flash medium	Qwen	8.2	6.9	$0.738	2/3	6.29s
Tests totaux 3 Tests incorrects 1 Coût total $0.738 Temps de réponse (moy.) 6.29s
#91	GPT-5.5 none	OpenAI	7.7	6.9	$0.544	2/3	1.29s
Tests totaux 3 Tests incorrects 1 Coût total $0.544 Temps de réponse (moy.) 1.29s
#93	Gemini 3 Flash Preview none	Google	7.7	6.8	$0.085	2/3	1.05s
Tests totaux 3 Tests incorrects 1 Coût total $0.085 Temps de réponse (moy.) 1.05s
#94	Qwen3.6 35B A3B medium	Qwen	8.0	6.7	$0.746	2/3	5.95s
Tests totaux 3 Tests incorrects 1 Coût total $0.746 Temps de réponse (moy.) 5.95s
#95	Gemini 3.5 Flash-Lite low	Google	7.8	6.7	$0.145	2/3	1.22s
Tests totaux 3 Tests incorrects 1 Coût total $0.145 Temps de réponse (moy.) 1.22s
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	8.2	6.7	$0.476	2/3	3.03s
Tests totaux 3 Tests incorrects 1 Coût total $0.476 Temps de réponse (moy.) 3.03s
#98	GLM 5V Turbo medium	Z.ai	7.7	6.7	$0.457	2/3	10.2s
Tests totaux 3 Tests incorrects 1 Coût total $0.457 Temps de réponse (moy.) 10.2s
#101	GLM 5.2 none	Z.ai	7.7	6.6	$0.128	2/3	3.31s
Tests totaux 3 Tests incorrects 1 Coût total $0.128 Temps de réponse (moy.) 3.31s
#104	Gemini 3.5 Flash-Lite medium	Google	8.4	6.5	$0.369	2/3	1.70s
Tests totaux 3 Tests incorrects 1 Coût total $0.369 Temps de réponse (moy.) 1.70s

Classement Résolution d'énigmes

Filtrer les modèles

Meilleurs modèles par Score Résolution d'énigmes

Score Résolution d'énigmes vs coût total

Meilleurs modèles par Temps de réponse (moy.)