AI BENCHY
Your ad here

AI BENCHY Kategoriefehler

Werkzeugaufrufe: API-Fehler

Werkzeugaufrufe
API-Fehler

Sieh, welche KI-Modelle bei Werkzeugaufrufe am ehesten auf API-Fehler stoßen, damit du Schwachstellen schneller erkennst. Sortieren nach: Antwortzeit (Durchschnitt) ↑.

Angezeigte Modelle

6

Gesamtfehler

6

Am stärksten betroffenes Modell

Gemma 4 31B 1
Rang Modell Unternehmen API-Fehler-Anzahl Kategorie-Score Korrekte Tests Antwortzeit (Durchschnitt)
#14 Gemma 4 31B medium Google 1 3.0 0/1 0ms
#33 GLM 5.1 medium Z.ai 1 3.0 0/1 0ms
#48 Gemma 4 31B none Google 1 3.0 0/1 0ms
#56 Grok 4.20 Multi Agent Beta medium X AI 1 3.0 0/1 0ms
#84 gpt-oss-120b none OpenAI 1 3.0 0/1 0ms
#98 LFM2-24B-A2B none Liquid 1 3.0 0/1 0ms

Top-Modelle nach API-Fehler-Anzahl

API-Fehler-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)

Top-Modelle nach Geschätzte verschwendete Kosten