Classement des modèles pour Appel d'outils

Voyez quels modèles d'IA réussissent le mieux sur Appel d'outils, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Tests corrects ↑.

Modèles affichés

Moyenne de Score Appel d'outils

8.7

Meilleur modèle

GPT-5.2 4.7

Raisons d'échec

Avec la raison d'échec Erreur API17 Avec la raison d'échec Appel d'outil invalide9 Avec la raison d'échec N'a pas suivi les instructions8 Avec la raison d'échec Mauvaise réponse3 Avec la raison d'échec Aucune réponse2

210/210

Rang	Modèle	Entreprise	Score Appel d'outils	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#21	GPT-5.2 medium	OpenAI	4.7	8.4	$0.951	0/1	10.3s
Tests totaux 1 Tests incorrects 1 Coût total $0.951 Temps de réponse (moy.) 10.3s
#28	Inkling high	Thinkingmachines	3.0	8.0	$1.006	0/1	6.52s
Tests totaux 1 Tests incorrects 1 Coût total $1.006 Temps de réponse (moy.) 6.52s
#32	Inkling medium	Thinkingmachines	3.0	8.0	$0.391	0/1	4.48s
Tests totaux 1 Tests incorrects 1 Coût total $0.391 Temps de réponse (moy.) 4.48s
#33	Kimi K3 max	Moonshot AI	3.0	8.0	$3.112	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $3.112 Temps de réponse (moy.) 0ms
#52	Kimi K2.7 Code medium	Moonshot AI	3.0	7.5	$0.751	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.751 Temps de réponse (moy.) 0ms
#55	GPT-5.6 Terra low	OpenAI	4.7	7.5	$0.519	0/1	6.69s
Tests totaux 1 Tests incorrects 1 Coût total $0.519 Temps de réponse (moy.) 6.69s
#56	GPT-5.4 Mini medium	OpenAI	4.7	7.5	$0.756	0/1	9.62s
Tests totaux 1 Tests incorrects 1 Coût total $0.756 Temps de réponse (moy.) 9.62s
#74	GLM 5.1 medium	Z.ai	3.0	7.1	$0.535	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.535 Temps de réponse (moy.) 0ms
#75	Grok 4.20 medium	X AI	3.0	7.1	$0.777	0/1	13.7s
Tests totaux 1 Tests incorrects 1 Coût total $0.777 Temps de réponse (moy.) 13.7s
#79	Gemini 3.5 Flash none	Google	3.0	7.0	$1.079	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $1.079 Temps de réponse (moy.) 0ms
#90	Qwen3.6 35B A3B medium	Qwen	3.0	6.7	$0.746	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.746 Temps de réponse (moy.) 0ms
#93	GLM 5V Turbo medium	Z.ai	7.0	6.7	$0.457	0/1	12.5s
Tests totaux 1 Tests incorrects 1 Coût total $0.457 Temps de réponse (moy.) 12.5s
#110	Gemma 4 31B medium	Google	3.0	6.3	$0.163	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.163 Temps de réponse (moy.) 0ms
#115	Gemma 4 31B none	Google	3.0	6.2	$0.035	0/1	0ms
Tests totaux 1 Tests incorrects 1 Coût total $0.035 Temps de réponse (moy.) 0ms
#123	Inkling low	Thinkingmachines	3.0	6.1	$0.187	0/1	2.57s
Tests totaux 1 Tests incorrects 1 Coût total $0.187 Temps de réponse (moy.) 2.57s

Classement Appel d'outils

Filtrer les modèles

Meilleurs modèles par Score Appel d'outils

Score Appel d'outils vs coût total

Meilleurs modèles par Temps de réponse (moy.)