AI BENCHY
Your ad here

AI BENCHY Kategoriefehler

Werkzeugaufrufe: Falsche Antwort

Werkzeugaufrufe
Falsche Antwort

Sieh, welche KI-Modelle bei Werkzeugaufrufe am ehesten auf Falsche Antwort stoßen, damit du Schwachstellen schneller erkennst. Sortieren nach: Antwortzeit (Durchschnitt) ↑.

Angezeigte Modelle

2

Gesamtfehler

2

Am stärksten betroffenes Modell

Grok 4.1 Fast 1

Top-Modelle nach Falsche Antwort-Anzahl

Falsche Antwort-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)

Top-Modelle nach Geschätzte verschwendete Kosten