AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Kategoriefehler

Werkzeugaufrufe: Falsche Antwort

Werkzeugaufrufe
Falsche Antwort

Sieh, welche KI-Modelle bei Werkzeugaufrufe am ehesten auf Falsche Antwort stoßen, damit du Schwachstellen schneller erkennst.

Angezeigte Modelle

2

Gesamtfehler

2

Am stärksten betroffenes Modell

GLM 4.7 Flash 1

Top-Modelle nach Falsche Antwort-Anzahl

Falsche Antwort-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)

Top-Modelle nach Geschätzte verschwendete Kosten