Classement des modèles pour Intelligence générale

Catégorie AI BENCHY

Voyez quels modèles d'IA réussissent le mieux sur Intelligence générale, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Temps de réponse (moy.) ↓.

Modèles affichés

Moyenne de Score Intelligence générale

5.9

Meilleur modèle

Qwen3.5-9B 2.8

Raisons d'échec

Avec la raison d'échec N'a pas suivi les instructions74 Avec la raison d'échec Mauvaise réponse32 Avec la raison d'échec Erreur API12 Avec la raison d'échec Délai dépassé4

Rang	Modèle	Entreprise	Score Intelligence générale	Score	Tests corrects	Temps de réponse (moy.)
#59	GLM 5V Turbo medium	Z.ai	10.0	7.2	1/1	11.1s
#126	gpt-oss-120b none	OpenAI	4.8	5.4	0/1	10.8s
#23	GLM 5 Turbo medium	Z.ai	6.1	8.0	0/1	10.1s
#39	Qwen3.6 Flash medium	Qwen	4.8	7.5	0/1	9.88s
#27	Gemma 4 31B medium	Google	10.0	7.8	1/1	9.57s
#35	Gemini 3 PRO Preview medium	Google	10.0	7.6	1/1	9.34s
#133	DeepSeek V3.2 none	DeepSeek	4.7	5.2	0/1	9.32s
#46	Qwen3.6 35B A3B medium	Qwen	4.4	7.4	0/1	8.66s
#99	gpt-oss-120b medium	OpenAI	4.3	6.1	0/1	7.90s
#57	Step 3.7 Flash low	Stepfun	3.4	7.3	0/1	7.00s
#105	Nemotron 3 Super medium	NVIDIA	4.1	5.8	0/1	6.91s
#143	MiMo-V2.5 none	Xiaomi	4.4	4.9	0/1	6.86s
#22	Step 3.7 Flash medium	Stepfun	4.0	8.0	0/1	6.85s
#129	MiniMax M2.5 medium	Minimax	3.8	5.3	0/1	6.63s
#79	Hunter Alpha medium	OpenRouter	7.0	6.7	0/1	6.44s

Classement Intelligence générale

Meilleurs modèles par Score Intelligence générale

Score Intelligence générale vs coût total

Meilleurs modèles par Temps de réponse (moy.)