Classement des modèles pour Résolution d'énigmes

Voyez quels modèles d'IA réussissent le mieux sur Résolution d'énigmes, lesquels restent fiables et où les écarts sont les plus marqués.

Modèles affichés

Moyenne de Score Résolution d'énigmes

6.7

Meilleur modèle

Gemini 3 Flash Preview 10.0

Raisons d'échec

Avec la raison d'échec Mauvaise réponse201 Avec la raison d'échec N'a pas suivi les instructions90 Avec la raison d'échec Erreur API12 Avec la raison d'échec Mise en forme supplémentaire8 Avec la raison d'échec Délai dépassé5 Avec la raison d'échec Aucune réponse3

210/210

Rang	Modèle	Entreprise	Score Résolution d'énigmes	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#94	Claude Opus 4.7 none	Anthropic	10.0	6.6	$0.505	3/3	2.46s
Tests totaux 3 Tests incorrects 0 Coût total $0.505 Temps de réponse (moy.) 2.46s
#95	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	3/3	5.79s
Tests totaux 3 Tests incorrects 0 Coût total $0.089 Temps de réponse (moy.) 5.79s
#98	Qwen3.6 Max Preview none	Qwen	10.0	6.6	$0.231	3/3	2.65s
Tests totaux 3 Tests incorrects 0 Coût total $0.231 Temps de réponse (moy.) 2.65s
#104	Gemini 3.1 Flash Lite Preview low	Google	10.0	6.5	$0.646	3/3	1.69s
Tests totaux 3 Tests incorrects 0 Coût total $0.646 Temps de réponse (moy.) 1.69s
#105	Gemini 3.1 Flash Lite low	Google	10.0	6.5	$0.621	3/3	1.40s
Tests totaux 3 Tests incorrects 0 Coût total $0.621 Temps de réponse (moy.) 1.40s
#106	Gemini 3.1 Flash Lite Preview none	Google	10.0	6.4	$0.052	3/3	900ms
Tests totaux 3 Tests incorrects 0 Coût total $0.052 Temps de réponse (moy.) 900ms
#131	Grok 4.20 Beta medium	X AI	10.0	6.0	$0.750	3/3	3.52s
Tests totaux 3 Tests incorrects 0 Coût total $0.750 Temps de réponse (moy.) 3.52s
#133	Gemini 3 PRO Preview medium	Google	10.0	6.0	$0.385	3/3	3.88s
Tests totaux 3 Tests incorrects 0 Coût total $0.385 Temps de réponse (moy.) 3.88s
#157	Mimo V2 Omni none	Xiaomi	10.0	5.5	$0.021	3/3	1.16s
Tests totaux 3 Tests incorrects 0 Coût total $0.021 Temps de réponse (moy.) 1.16s
#110	Gemma 4 31B medium	Google	9.9	6.3	$0.163	3/3	26.9s
Tests totaux 3 Tests incorrects 0 Coût total $0.163 Temps de réponse (moy.) 26.9s
#13	GPT-5.3-Codex medium	OpenAI	9.0	8.9	$0.920	2/3	5.05s
Tests totaux 3 Tests incorrects 1 Coût total $0.920 Temps de réponse (moy.) 5.05s
#35	Seed-2.0-Lite medium	Bytedance Seed	9.0	7.9	$0.234	2/3	10.2s
Tests totaux 3 Tests incorrects 1 Coût total $0.234 Temps de réponse (moy.) 10.2s
#49	GLM 5 Turbo medium	Z.ai	8.7	7.6	$0.323	2/3	5.23s
Tests totaux 3 Tests incorrects 1 Coût total $0.323 Temps de réponse (moy.) 5.23s
#39	GPT-5.6 Terra medium	OpenAI	8.4	7.8	$0.676	2/3	3.78s
Tests totaux 3 Tests incorrects 1 Coût total $0.676 Temps de réponse (moy.) 3.78s
#24	Muse Spark 1.1 low	Meta	8.3	8.3	$0.647	2/3	6.60s
Tests totaux 3 Tests incorrects 1 Coût total $0.647 Temps de réponse (moy.) 6.60s

Classement Résolution d'énigmes

Filtrer les modèles

Meilleurs modèles par Score Résolution d'énigmes

Score Résolution d'énigmes vs coût total

Meilleurs modèles par Temps de réponse (moy.)