AI BENCHY
Vergleichen Diagramme Methodik
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Fehler

Ungültiger Werkzeugaufruf-Fehler

Sieh, bei welchen KI-Modellen Ungültiger Werkzeugaufruf besonders häufig auftritt, damit du Zuverlässigkeitsrisiken vor der Auswahl erkennst. Sortieren nach: Antwortzeit (Durchschnitt) ↑.

Angezeigte Modelle

4

Gesamtfehler

4

Am stärksten betroffenes Modell

GLM 4.7 Flash 1

Verwandte Kategorien

Rang Modell Unternehmen Ungültiger Werkzeugaufruf-Anzahl Ø-Score Korrekte Tests Antwortzeit (Durchschnitt)
#49 GLM 4.7 Flash none Z.ai 1 3.9 4/16 2.99s
#33 DeepSeek V3.2 none DeepSeek 1 5.5 7/16 12.9s
#52 GLM 4.7 Flash medium Z.ai 1 3.1 4/16 36.8s
#43 MiniMax M2.5 medium Minimax 1 4.7 5/16 43.0s

Top-Modelle nach Ungültiger Werkzeugaufruf-Anzahl

Ungültiger Werkzeugaufruf-Anzahl vs. Ø-Score

Top-Modelle nach Antwortzeit (Durchschnitt)