Classement des modèles pour Résolution d'énigmes

Voyez quels modèles d'IA réussissent le mieux sur Résolution d'énigmes, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Temps de réponse (moy.) ↑.

Modèles affichés

Moyenne de Score Résolution d'énigmes

6.7

Meilleur modèle

Step 3.5 Flash 0.0

Raisons d'échec

Avec la raison d'échec Mauvaise réponse204 Avec la raison d'échec N'a pas suivi les instructions90 Avec la raison d'échec Erreur API12 Avec la raison d'échec Mise en forme supplémentaire8 Avec la raison d'échec Délai dépassé5 Avec la raison d'échec Aucune réponse3

216/216

Rang	Modèle	Entreprise	Score Résolution d'énigmes	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#87	GPT-5.6 Sol none	OpenAI	7.7	6.9	$0.524	2/3	1.49s
Tests totaux 3 Tests incorrects 1 Coût total $0.524 Temps de réponse (moy.) 1.49s
#164	KAT-Coder-Air V2.5 low	Kwaipilot	3.1	5.4	$0.041	0/3	1.57s
Tests totaux 3 Tests incorrects 3 Coût total $0.041 Temps de réponse (moy.) 1.57s
#153	Mimo V2 PRO none	Xiaomi	6.0	5.6	$0.045	1/3	1.61s
Tests totaux 3 Tests incorrects 2 Coût total $0.045 Temps de réponse (moy.) 1.61s
#110	Gemini 3.1 Flash Lite Preview low	Google	10.0	6.5	$0.646	3/3	1.69s
Tests totaux 3 Tests incorrects 0 Coût total $0.646 Temps de réponse (moy.) 1.69s
#104	Gemini 3.5 Flash-Lite medium	Google	8.4	6.5	$0.369	2/3	1.70s
Tests totaux 3 Tests incorrects 1 Coût total $0.369 Temps de réponse (moy.) 1.70s
#75	Qwen3.7 Plus none	Qwen	7.7	7.2	$0.106	2/3	1.71s
Tests totaux 3 Tests incorrects 1 Coût total $0.106 Temps de réponse (moy.) 1.71s
#216	LFM2-24B-A2B none	Liquid	3.8	2.2	$0.001	0/3	1.78s
Tests totaux 3 Tests incorrects 3 Coût total $0.001 Temps de réponse (moy.) 1.78s
#71	Step 3.7 Flash low	Stepfun	5.5	7.3	$0.454	1/3	1.84s
Tests totaux 3 Tests incorrects 2 Coût total $0.454 Temps de réponse (moy.) 1.84s
#188	KAT-Coder-Air V2.5 none	Kwaipilot	2.9	4.8	$0.067	0/3	1.84s
Tests totaux 3 Tests incorrects 3 Coût total $0.067 Temps de réponse (moy.) 1.84s
#31	Gemini 3.5 Flash-Lite high	Google	8.2	8.1	$0.584	2/3	1.85s
Tests totaux 3 Tests incorrects 1 Coût total $0.584 Temps de réponse (moy.) 1.85s
#206	MiMo-V2-Flash none	Xiaomi	5.3	4.0	$0.025	1/3	1.86s
Tests totaux 3 Tests incorrects 2 Coût total $0.025 Temps de réponse (moy.) 1.86s
#155	KAT-Coder-Air V2.5 medium	Kwaipilot	3.6	5.6	$0.048	0/3	1.87s
Tests totaux 3 Tests incorrects 3 Coût total $0.048 Temps de réponse (moy.) 1.87s
#147	GLM 5 none	Z.ai	7.7	5.7	$0.041	2/3	1.91s
Tests totaux 3 Tests incorrects 1 Coût total $0.041 Temps de réponse (moy.) 1.91s
#6	Gemini 3.6 Flash low	Google	10.0	9.4	$0.517	3/3	1.91s
Tests totaux 3 Tests incorrects 0 Coût total $0.517 Temps de réponse (moy.) 1.91s
#204	Laguna Xs.2 medium	Poolside	5.3	4.1	$0.015	1/3	1.93s
Tests totaux 3 Tests incorrects 2 Coût total $0.015 Temps de réponse (moy.) 1.93s

Classement Résolution d'énigmes

Filtrer les modèles

Meilleurs modèles par Score Résolution d'énigmes

Score Résolution d'énigmes vs coût total

Meilleurs modèles par Temps de réponse (moy.)