Échecs par catégorie AI BENCHY
Appel d'outils : Appel d'outil invalide
Appel d'outils
Appel d'outil invalide
Voyez quels modèles d'IA ont le plus de chances de rencontrer Appel d'outil invalide sur Appel d'outils, pour repérer plus vite les points faibles.
Raisons d'échec
Catégories
| Rang | Modèle | Entreprise | Nombre de Appel d'outil invalide | Score de catégorie | Tests corrects | Temps de réponse (moy.) |
|---|---|---|---|---|---|---|
| #31 | GLM 5V Turbo medium | Z.ai | 1 | 7.0 | 0/1 | 12.5s |
| #81 | Elephant medium | Openrouter | 1 | 3.0 | 0/1 | 2.83s |
| #85 | Elephant none | Openrouter | 1 | 3.0 | 0/1 | 2.79s |