AI BENCHY
Vergleichen Diagramme Methodik
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Kategoriefehler

Datenanalyse und -extraktion
API-Fehler

Sieh, welche KI-Modelle bei Datenanalyse und -extraktion am ehesten auf API-Fehler stoßen, damit du Schwachstellen schneller erkennst. Sortieren nach: Korrekte Tests ↓.

Angezeigte Modelle

4

Gesamtfehler

4

Am stärksten betroffenes Modell

MiMo-V2-Flash 1
Rang Modell Unternehmen API-Fehler-Anzahl Kategorie-Score Korrekte Tests Antwortzeit (Durchschnitt)
#21 MiMo-V2-Flash medium Xiaomi 1 5.5 1/2 0ms
#24 Qwen3.5-Flash medium Qwen 1 5.5 1/2 57.0s
#35 Qwen3.5-35B-A3B medium Qwen 1 5.5 1/2 59.3s
#54 MiMo-V2-Flash none Xiaomi 1 10.0 0/2 19.7s

Top-Modelle nach API-Fehler-Anzahl

API-Fehler-Anzahl vs. Ø-Score

Top-Modelle nach Antwortzeit (Durchschnitt)

Top-Modelle nach Geschätzte verschwendete Kosten