Classement des modèles pour Intelligence générale

Catégorie AI BENCHY

Voyez quels modèles d'IA réussissent le mieux sur Intelligence générale, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Tests corrects ↑.

Modèles affichés

Moyenne de Score Intelligence générale

5.9

Meilleur modèle

GPT-5.3-Codex 4.6

Raisons d'échec

Avec la raison d'échec N'a pas suivi les instructions74 Avec la raison d'échec Mauvaise réponse32 Avec la raison d'échec Erreur API12 Avec la raison d'échec Délai dépassé4

Rang	Modèle	Entreprise	Score Intelligence générale	Score	Tests corrects	Temps de réponse (moy.)
#62	Step 3.5 Flash medium	Stepfun	5.5	7.2	0/1	22.4s
#63	GPT-5.3 Chat none	OpenAI	4.6	7.2	0/1	1.99s
#64	MiMo-V2-Flash medium	Xiaomi	4.0	7.2	0/1	4.20s
#65	Grok 4.20 medium	X AI	3.9	7.1	0/1	24.5s
#66	Qwen3.5-35B-A3B medium	Qwen	2.8	7.1	0/1	30.3s
#67	MiniMax M3 medium	Minimax	5.1	7.1	0/1	33.3s
#70	GPT-5.4 Nano medium	OpenAI	4.5	7.0	0/1	4.15s
#71	Step 3.7 Flash high	Stepfun	5.5	7.0	0/1	4.17s
#72	DeepSeek V3.2 medium	DeepSeek	3.4	7.0	0/1	58.3s
#73	Seed-2.0-Mini medium	Bytedance Seed	5.1	6.9	0/1	36.7s
#74	Qwen3.6 Max Preview none	Qwen	4.3	6.9	0/1	1.62s
#75	Ring-2.6-1T medium	Inclusionai	4.1	6.9	0/1	58.3s
#76	Kimi K2.5 medium	Moonshot AI	6.5	6.8	0/1	69.7s
#77	Claude Sonnet 4.6 none	Anthropic	6.1	6.8	0/1	2.56s
#78	Qwen3.6 27B medium	Qwen	6.5	6.8	0/1	39.5s

Classement Intelligence générale

Meilleurs modèles par Score Intelligence générale

Score Intelligence générale vs coût total

Meilleurs modèles par Temps de réponse (moy.)