AI BENCHY Kategoriefehler
Werkzeugaufrufe: Ungültiger Werkzeugaufruf
Werkzeugaufrufe
Ungültiger Werkzeugaufruf
Sieh, welche KI-Modelle bei Werkzeugaufrufe am ehesten auf Ungültiger Werkzeugaufruf stoßen, damit du Schwachstellen schneller erkennst. Sortieren nach: Korrekte Tests ↓.
Fehlergründe
Kategorien
| Rang | Modell | Unternehmen | Ungültiger Werkzeugaufruf-Anzahl | Kategorie-Score | Korrekte Tests | Antwortzeit (Durchschnitt) |
|---|---|---|---|---|---|---|
| #31 | GLM 5V Turbo medium | Z.ai | 1 | 7.0 | 0/1 | 12.5s |
| #81 | Elephant medium | Openrouter | 1 | 3.0 | 0/1 | 2.83s |
| #85 | Elephant none | Openrouter | 1 | 3.0 | 0/1 | 2.79s |