Classement des modèles pour Appel d'outils

Voyez quels modèles d'IA réussissent le mieux sur Appel d'outils, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Métrique ↑.

Modèles affichés

Moyenne de Score Appel d'outils

8.8

Meilleur modèle

Hy3 preview 2.8

Raisons d'échec

Avec la raison d'échec Erreur API17 Avec la raison d'échec Appel d'outil invalide9 Avec la raison d'échec N'a pas suivi les instructions8 Avec la raison d'échec Mauvaise réponse4 Avec la raison d'échec Aucune réponse2

220/220

Rang	Modèle	Entreprise	Score Appel d'outils	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#19	Muse Spark 1.1 medium	Meta	9.8	8.6	$1.357	1/1	6.99s
Tests totaux 1 Tests incorrects 0 Coût total $1.357 Temps de réponse (moy.) 6.99s
#27	Muse Spark 1.1 low	Meta	9.8	8.3	$0.647	1/1	5.98s
Tests totaux 1 Tests incorrects 0 Coût total $0.647 Temps de réponse (moy.) 5.98s
#50	DeepSeek V4 Pro high	DeepSeek	9.8	7.7	$0.200	1/1	15.9s
Tests totaux 1 Tests incorrects 0 Coût total $0.200 Temps de réponse (moy.) 15.9s
#95	Gemini 3.5 Flash-Lite low	Google	9.8	6.7	$0.145	1/1	1.76s
Tests totaux 1 Tests incorrects 0 Coût total $0.145 Temps de réponse (moy.) 1.76s
#127	gpt-oss-120b medium	OpenAI	9.8	6.1	$0.019	1/1	6.91s
Tests totaux 1 Tests incorrects 0 Coût total $0.019 Temps de réponse (moy.) 6.91s
#1	Gemini 3.6 Flash medium	Google	10.0	9.9	$0.831	1/1	8.55s
Tests totaux 1 Tests incorrects 0 Coût total $0.831 Temps de réponse (moy.) 8.55s
#2	Gemini 3.6 Flash high	Google	10.0	9.7	$1.785	1/1	9.76s
Tests totaux 1 Tests incorrects 0 Coût total $1.785 Temps de réponse (moy.) 9.76s
#3	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	1/1	12.6s
Tests totaux 1 Tests incorrects 0 Coût total $0.742 Temps de réponse (moy.) 12.6s
#5	GPT-5.6 Sol low	OpenAI	10.0	9.5	$0.971	1/1	7.56s
Tests totaux 1 Tests incorrects 0 Coût total $0.971 Temps de réponse (moy.) 7.56s
#6	Gemini 3.6 Flash low	Google	10.0	9.4	$0.517	1/1	4.78s
Tests totaux 1 Tests incorrects 0 Coût total $0.517 Temps de réponse (moy.) 4.78s
#7	GPT-5.6 Sol medium	OpenAI	10.0	9.4	$1.316	1/1	6.30s
Tests totaux 1 Tests incorrects 0 Coût total $1.316 Temps de réponse (moy.) 6.30s
#8	GPT-5.6 Sol high	OpenAI	10.0	9.4	$1.234	1/1	7.08s
Tests totaux 1 Tests incorrects 0 Coût total $1.234 Temps de réponse (moy.) 7.08s
#9	GPT-5.5 low	OpenAI	10.0	9.3	$1.253	1/1	4.96s
Tests totaux 1 Tests incorrects 0 Coût total $1.253 Temps de réponse (moy.) 4.96s
#10	Gemini 3.1 Pro Preview medium	Google	10.0	9.2	$1.361	1/1	23.1s
Tests totaux 1 Tests incorrects 0 Coût total $1.361 Temps de réponse (moy.) 23.1s
#11	Qwen3.7 Max medium	Qwen	10.0	9.2	$1.116	1/1	6.63s
Tests totaux 1 Tests incorrects 0 Coût total $1.116 Temps de réponse (moy.) 6.63s

Classement Appel d'outils

Filtrer les modèles

Meilleurs modèles par Score Appel d'outils

Score Appel d'outils vs coût total

Meilleurs modèles par Temps de réponse (moy.)