Classement des modèles pour Résolution d'énigmes

Catégorie AI BENCHY

Voyez quels modèles d'IA réussissent le mieux sur Résolution d'énigmes, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Temps de réponse (moy.) ↓.

Modèles affichés

Moyenne de Score Résolution d'énigmes

6.7

Meilleur modèle

Qwen3.6 27B 7.7

Raisons d'échec

Avec la raison d'échec Mauvaise réponse147 Avec la raison d'échec N'a pas suivi les instructions78 Avec la raison d'échec Erreur API13 Avec la raison d'échec Délai dépassé5 Avec la raison d'échec Mise en forme supplémentaire5 Avec la raison d'échec Aucune réponse1

Rang	Modèle	Entreprise	Score Résolution d'énigmes	Score	Tests corrects	Temps de réponse (moy.)
#69	Claude Opus 4.6 medium	Anthropic	7.7	7.0	2/3	4.71s
#156	Hy3 preview none	Tencent	3.1	4.4	0/3	4.56s
#45	GPT-5.4 Mini medium	OpenAI	7.8	7.5	2/3	4.37s
#85	Gemma 4 31B none	Google	6.5	6.5	1/3	4.23s
#121	Owl Alpha none	Openrouter	5.4	5.5	1/3	4.18s
#24	GPT-5.2 Chat none	OpenAI	7.7	7.9	2/3	4.10s
#1	Gemini 3 Flash Preview medium	Google	10.0	9.8	3/3	4.05s
#135	Kimi K2.5 none	Moonshot AI	3.0	5.2	0/3	4.04s
#10	Claude Opus 4.8 medium	Anthropic	10.0	8.7	3/3	3.95s
#35	Gemini 3 PRO Preview medium	Google	10.0	7.6	3/3	3.88s
#64	MiMo-V2-Flash medium	Xiaomi	7.7	7.2	2/3	3.87s
#70	GPT-5.4 Nano medium	OpenAI	4.1	7.0	0/3	3.79s
#116	Hunter Alpha none	OpenRouter	5.8	5.7	1/3	3.71s
#41	Nemotron 3 Ultra 550b A55b medium	NVIDIA	5.5	7.5	1/3	3.54s
#13	Grok 4.20 Beta medium	X AI	10.0	8.5	3/3	3.52s

Classement Résolution d'énigmes

Meilleurs modèles par Score Résolution d'énigmes

Score Résolution d'énigmes vs coût total

Meilleurs modèles par Temps de réponse (moy.)