AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Échecs par catégorie AI BENCHY

Appel d'outils : Appel d'outil invalide

Appel d'outils
Appel d'outil invalide

Voyez quels modèles d'IA ont le plus de chances de rencontrer Appel d'outil invalide sur Appel d'outils, pour repérer plus vite les points faibles.

Modèles affichés

3

Échecs totaux

3

Modèle le plus touché

GLM 5V Turbo 1
Rang Modèle Entreprise Nombre de Appel d'outil invalide Score de catégorie Tests corrects Temps de réponse (moy.)
#31 GLM 5V Turbo medium Z.ai 1 7.0 0/1 12.5s
#81 Elephant medium Openrouter 1 3.0 0/1 2.83s
#85 Elephant none Openrouter 1 3.0 0/1 2.79s

Meilleurs modèles par Nombre de Appel d'outil invalide

Nombre de Appel d'outil invalide vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé