Classement Intelligence générale x Erreur API

Voyez quels modèles d'IA ont le plus de chances de rencontrer Erreur API sur Intelligence générale, pour repérer plus vite les points faibles. Trier par: Tests corrects ↑.

Modèles affichés

Échecs totaux

Modèle le plus touché

Nemotron 3 Ultra 1

Raisons d'échec

N'a pas suivi les instructions78 Mauvaise réponse62 Erreur API12 Délai dépassé4

Catégories

Programmation45 Combiné26 Appel d'outils17 Analyse et extraction des données14 Astuces anti-IA14 Culture générale13 Intelligence générale12 Résolution d'énigmes12 Spécifique au domaine7 Suivi des instructions1

12/12

Rang	Modèle	Entreprise	Nombre de Erreur API	Score de catégorie	Coût total	Tests corrects	Temps de réponse (moy.)
#55	Nemotron 3 Ultra medium	NVIDIA	1	3.7	$0.774	0/1	2.52s
Tests totaux 1 Tests incorrects 1 Coût total $0.774 Temps de réponse (moy.) 2.52s
#80	DeepSeek V3.2 medium	DeepSeek	1	3.4	$0.078	0/1	58.3s
Tests totaux 1 Tests incorrects 1 Coût total $0.078 Temps de réponse (moy.) 58.3s
#141	Hy3 preview high	Tencent	1	3.0	$0.048	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.048 Temps de réponse (moy.) 0ms
#159	Hy3 preview low	Tencent	1	3.0	$0.015	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.015 Temps de réponse (moy.) 0ms
#179	DeepSeek V3.2 none	DeepSeek	1	4.7	$0.054	0/1	9.32s
Tests totaux 1 Tests incorrects 1 Coût total $0.054 Temps de réponse (moy.) 9.32s
#181	Qwen3.6 Plus Preview medium	Qwen	1	3.0	$0.000	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.000 Temps de réponse (moy.) 0ms
#192	Laguna M.1 medium	Poolside	1	3.0	$0.033	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.033 Temps de réponse (moy.) 0ms
#198	Laguna M.1 none	Poolside	1	3.0	$0.009	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.009 Temps de réponse (moy.) 0ms
#204	Laguna Xs.2 medium	Poolside	1	3.0	$0.015	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.015 Temps de réponse (moy.) 0ms
#211	Laguna Xs.2 none	Poolside	1	3.0	$0.004	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.004 Temps de réponse (moy.) 0ms
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	3.0	$0.000	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.000 Temps de réponse (moy.) 0ms
#214	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	1	3.0	$0.000	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.000 Temps de réponse (moy.) 0ms

Filtrer les modèles

Meilleurs modèles par Nombre de Erreur API

Nombre de Erreur API vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé

Intelligence générale : Erreur API

Filtrer les modèles

Meilleurs modèles par Nombre de Erreur API

Nombre de Erreur API vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé