Classement des modèles pour Combiné

Voyez quels modèles d'IA réussissent le mieux sur Combiné, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Temps de réponse (moy.) ↑.

Modèles affichés

Moyenne de Score Combiné

5.5

Meilleur modèle

Gemini 3.5 Flash 3.0

Raisons d'échec

Avec la raison d'échec Appel d'outil invalide91 Avec la raison d'échec Mauvaise réponse68 Avec la raison d'échec Aucune réponse29 Avec la raison d'échec Erreur API26 Avec la raison d'échec Délai dépassé5 Avec la raison d'échec Mise en forme supplémentaire1 Avec la raison d'échec N'a pas suivi les instructions1

210/210

Rang	Modèle	Entreprise	Score Combiné	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#79	Gemini 3.5 Flash none	Google	3.0	7.0	$1.079	0/2	0ms
Tests totaux 2 Tests incorrects 2 Coût total $1.079 Temps de réponse (moy.) 0ms
#179	Ring-2.6-1T none	Inclusionai	3.0	4.8	$0.026	0/2	0ms
Tests totaux 2 Tests incorrects 2 Coût total $0.026 Temps de réponse (moy.) 0ms
#181	Grok 4.20 Multi Agent Beta medium	X AI	1.5	4.8	$5.599	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $5.599 Temps de réponse (moy.) 0ms
#202	Grok Build 0.1 none	X AI	1.5	4.0	$0.547	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.547 Temps de réponse (moy.) 0ms
#204	Qwen3.5-9B medium	Qwen	3.0	3.8	$0.036	0/2	0ms
Tests totaux 2 Tests incorrects 2 Coût total $0.036 Temps de réponse (moy.) 0ms
#206	gpt-oss-120b none	OpenAI	1.5	3.7	$0.010	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.010 Temps de réponse (moy.) 0ms
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1.5	3.4	$0.000	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.000 Temps de réponse (moy.) 0ms
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	1.5	3.2	$0.000	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.000 Temps de réponse (moy.) 0ms
#209	Step 3.5 Flash none	Stepfun	1.5	2.3	$0.020	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.020 Temps de réponse (moy.) 0ms
#210	LFM2-24B-A2B none	Liquid	1.5	2.2	$0.001	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.001 Temps de réponse (moy.) 0ms
#205	Laguna Xs.2 none	Poolside	1.5	3.8	$0.004	0/1	2.01s
Tests totaux 1 Tests incorrects 1 Coût total $0.004 Temps de réponse (moy.) 2.01s
#189	Mercury 2 none	Inception	3.0	4.6	$0.030	0/2	2.56s
Tests totaux 2 Tests incorrects 2 Coût total $0.030 Temps de réponse (moy.) 2.56s
#200	MiMo-V2-Flash none	Xiaomi	1.5	4.0	$0.025	0/1	2.87s
Tests totaux 1 Tests incorrects 1 Coût total $0.025 Temps de réponse (moy.) 2.87s
#203	Grok 4.1 Fast none	X AI	1.5	3.8	$0.008	0/1	3.33s
Tests totaux 1 Tests incorrects 1 Coût total $0.008 Temps de réponse (moy.) 3.33s
#195	Elephant Alpha medium	Openrouter	1.5	4.3	$0.000	0/1	3.70s
Tests totaux 1 Tests incorrects 1 Coût total $0.000 Temps de réponse (moy.) 3.70s

Classement Combiné

Filtrer les modèles

Meilleurs modèles par Score Combiné

Score Combiné vs coût total

Meilleurs modèles par Temps de réponse (moy.)