Classement des modèles pour Culture générale

Catégorie AI BENCHY

Voyez quels modèles d'IA réussissent le mieux sur Culture générale, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Temps de réponse (moy.) ↑.

Modèles affichés

Moyenne de Score Culture générale

3.1

Meilleur modèle

Grok 4.20 Beta 0.0

Raisons d'échec

Avec la raison d'échec Mauvaise réponse133 Avec la raison d'échec Erreur API13 Avec la raison d'échec Aucune réponse8

169/169

Rang	Modèle	Entreprise	Score Culture générale	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#156	Laguna Xs.2 medium	Poolside	3.0	4.3	$0.000	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.000 Temps de réponse (moy.) 0ms
#162	Laguna Xs.2 none	Poolside	3.0	4.0	$0.000	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.000 Temps de réponse (moy.) 0ms
#166	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	3.0	3.6	$0.000	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.000 Temps de réponse (moy.) 0ms
#167	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.0	3.5	$0.000	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.000 Temps de réponse (moy.) 0ms
#169	LFM2-24B-A2B none	Liquid	0.0	2.4	$0.001	0/0	0ms
Tests totaux 0 Tests incorrects 0 Coût total $0.001 Temps de réponse (moy.) 0ms
#125	Qwen3.5-122B-A10B none	Qwen	3.0	5.3	$0.020	0/1	295ms
Tests totaux 1 Tests incorrects 1 Coût total $0.020 Temps de réponse (moy.) 295ms
#163	Granite 4.1 8B none	IBM Granite	3.0	4.0	$0.003	0/1	306ms
Tests totaux 1 Tests incorrects 1 Coût total $0.003 Temps de réponse (moy.) 306ms
#129	Mistral Small 4 none	Mistral	3.0	5.1	$0.007	0/1	397ms
Tests totaux 1 Tests incorrects 1 Coût total $0.007 Temps de réponse (moy.) 397ms
#148	Qwen3 Coder Next medium	Qwen	3.0	4.7	$0.008	0/1	399ms
Tests totaux 1 Tests incorrects 1 Coût total $0.008 Temps de réponse (moy.) 399ms
#128	Qwen3.6 35B A3B none	Qwen	3.0	5.2	$0.031	0/1	414ms
Tests totaux 1 Tests incorrects 1 Coût total $0.031 Temps de réponse (moy.) 414ms
#103	Qwen3.5-35B-A3B none	Qwen	3.0	5.9	$0.012	0/1	493ms
Tests totaux 1 Tests incorrects 1 Coût total $0.012 Temps de réponse (moy.) 493ms
#151	Mercury 2 none	Inception	3.0	4.6	$0.011	0/1	548ms
Tests totaux 1 Tests incorrects 1 Coût total $0.011 Temps de réponse (moy.) 548ms
#97	Qwen3.5-Flash none	Qwen	3.0	6.1	$0.005	0/1	588ms
Tests totaux 1 Tests incorrects 1 Coût total $0.005 Temps de réponse (moy.) 588ms
#104	Qwen3.5-27B none	Qwen	3.0	5.9	$0.015	0/1	599ms
Tests totaux 1 Tests incorrects 1 Coût total $0.015 Temps de réponse (moy.) 599ms
#130	Qwen3 Coder Next none	Qwen	3.0	5.1	$0.009	0/1	601ms
Tests totaux 1 Tests incorrects 1 Coût total $0.009 Temps de réponse (moy.) 601ms

Classement Culture générale

Filtrer les modèles

Meilleurs modèles par Score Culture générale

Score Culture générale vs coût total

Meilleurs modèles par Temps de réponse (moy.)