Classement des modèles pour Appel d'outils

Voyez quels modèles d'IA réussissent le mieux sur Appel d'outils, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Métrique ↑.

Modèles affichés

Moyenne de Score Appel d'outils

8.7

Meilleur modèle

Hy3 preview 2.8

Raisons d'échec

Avec la raison d'échec Erreur API17 Avec la raison d'échec Appel d'outil invalide9 Avec la raison d'échec N'a pas suivi les instructions8 Avec la raison d'échec Mauvaise réponse3 Avec la raison d'échec Aucune réponse2

210/210

Rang	Modèle	Entreprise	Score Appel d'outils	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#209	Step 3.5 Flash none	Stepfun	3.0	2.3	$0.020	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.020 Temps de réponse (moy.) 0ms
#210	LFM2-24B-A2B none	Liquid	3.0	2.2	$0.001	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.001 Temps de réponse (moy.) 0ms
#21	GPT-5.2 medium	OpenAI	4.7	8.4	$0.951	0/1	10.3s
Tests totaux 1 Tests incorrects 1 Coût total $0.951 Temps de réponse (moy.) 10.3s
#55	GPT-5.6 Terra low	OpenAI	4.7	7.5	$0.519	0/1	6.69s
Tests totaux 1 Tests incorrects 1 Coût total $0.519 Temps de réponse (moy.) 6.69s
#56	GPT-5.4 Mini medium	OpenAI	4.7	7.5	$0.756	0/1	9.62s
Tests totaux 1 Tests incorrects 1 Coût total $0.756 Temps de réponse (moy.) 9.62s
#172	MiniMax M2.7 medium	Minimax	4.7	5.0	$0.163	0/1	12.0s
Tests totaux 1 Tests incorrects 1 Coût total $0.163 Temps de réponse (moy.) 12.0s
#177	Nemotron 3 Super none	NVIDIA	4.7	4.9	$0.008	0/1	16.0s
Tests totaux 1 Tests incorrects 1 Coût total $0.008 Temps de réponse (moy.) 16.0s
#198	Laguna Xs.2 medium	Poolside	4.7	4.1	$0.015	0/1	3.39s
Tests totaux 1 Tests incorrects 1 Coût total $0.015 Temps de réponse (moy.) 3.39s
#93	GLM 5V Turbo medium	Z.ai	7.0	6.7	$0.457	0/1	12.5s
Tests totaux 1 Tests incorrects 1 Coût total $0.457 Temps de réponse (moy.) 12.5s
#152	Qwen3.6 27B none	Qwen	9.5	5.5	$0.087	1/1	6.74s
Tests totaux 1 Tests incorrects 0 Coût total $0.087 Temps de réponse (moy.) 6.74s
#171	North Mini Code none	Cohere	9.5	5.1	$0.000	1/1	3.64s
Tests totaux 1 Tests incorrects 0 Coût total $0.000 Temps de réponse (moy.) 3.64s
#27	Muse Spark 1.1 high	Meta	9.6	8.1	$1.694	1/1	9.88s
Tests totaux 1 Tests incorrects 0 Coût total $1.694 Temps de réponse (moy.) 9.88s
#132	GPT-5.6 Terra none	OpenAI	9.6	6.0	$0.349	1/1	3.10s
Tests totaux 1 Tests incorrects 0 Coût total $0.349 Temps de réponse (moy.) 3.10s
#2	Gemini 3.5 Flash high	Google	9.8	9.5	$1.976	1/1	4.96s
Tests totaux 1 Tests incorrects 0 Coût total $1.976 Temps de réponse (moy.) 4.96s
#16	Muse Spark 1.1 medium	Meta	9.8	8.6	$1.357	1/1	6.99s
Tests totaux 1 Tests incorrects 0 Coût total $1.357 Temps de réponse (moy.) 6.99s

Classement Appel d'outils

Filtrer les modèles

Meilleurs modèles par Score Appel d'outils

Score Appel d'outils vs coût total

Meilleurs modèles par Temps de réponse (moy.)