Classement des modèles pour Intelligence générale

Catégorie AI BENCHY

Voyez quels modèles d'IA réussissent le mieux sur Intelligence générale, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Tests corrects ↑.

Modèles affichés

Moyenne de Score Intelligence générale

5.9

Meilleur modèle

GPT-5.3-Codex 4.6

Raisons d'échec

Avec la raison d'échec N'a pas suivi les instructions74 Avec la raison d'échec Mauvaise réponse32 Avec la raison d'échec Erreur API12 Avec la raison d'échec Délai dépassé4

Rang	Modèle	Entreprise	Score Intelligence générale	Score	Tests corrects	Temps de réponse (moy.)
#39	Qwen3.6 Flash medium	Qwen	4.8	7.5	0/1	9.88s
#41	Nemotron 3 Ultra 550b A55b medium	NVIDIA	3.7	7.5	0/1	2.52s
#42	GPT-5.2 medium	OpenAI	3.7	7.5	0/1	4.32s
#43	MiMo-V2.5-Pro medium	Xiaomi	5.5	7.5	0/1	4.02s
#45	GPT-5.4 Mini medium	OpenAI	4.5	7.5	0/1	3.72s
#46	Qwen3.6 35B A3B medium	Qwen	4.4	7.4	0/1	8.66s
#47	Grok Build 0.1 medium	X AI	4.4	7.4	0/1	18.4s
#49	Qwen3.5-Flash medium	Qwen	6.1	7.4	0/1	40.1s
#50	Gemini 3.1 Flash Lite Preview low	Google	4.0	7.4	0/1	1.54s
#53	Gemini 3.1 Flash Lite high	Google	5.0	7.3	0/1	45.7s
#54	GPT-5 Mini medium	OpenAI	4.5	7.3	0/1	13.5s
#56	MiMo-V2.5 medium	Xiaomi	5.4	7.3	0/1	5.37s
#57	Step 3.7 Flash low	Stepfun	3.4	7.3	0/1	7.00s
#58	Gemini 3.1 Flash Lite Preview none	Google	4.0	7.2	0/1	741ms
#61	Gemini 3.1 Flash Lite low	Google	4.0	7.2	0/1	1.37s

Classement Intelligence générale

Meilleurs modèles par Score Intelligence générale

Score Intelligence générale vs coût total

Meilleurs modèles par Temps de réponse (moy.)