AI BENCHY
Vergleichen Diagramme Methodik
❤️ Made by XCS
Your ad here

AI BENCHY Kategoriefehler

Datenanalyse und -extraktion
API-Fehler

Sieh, welche KI-Modelle bei Datenanalyse und -extraktion am ehesten auf API-Fehler stoßen, damit du Schwachstellen schneller erkennst. Sortieren nach: Antwortzeit (Durchschnitt) ↓.

Angezeigte Modelle

4

Gesamtfehler

4

Am stärksten betroffenes Modell

Qwen3.5-35B-A3B 1
Rang Modell Unternehmen API-Fehler-Anzahl Kategorie-Score Korrekte Tests Antwortzeit (Durchschnitt)
#35 Qwen3.5-35B-A3B medium Qwen 1 5.5 1/2 59.3s
#24 Qwen3.5-Flash medium Qwen 1 5.5 1/2 57.0s
#54 MiMo-V2-Flash none Xiaomi 1 10.0 0/2 19.7s
#21 MiMo-V2-Flash medium Xiaomi 1 5.5 1/2 0ms

Top-Modelle nach API-Fehler-Anzahl

API-Fehler-Anzahl vs. Ø-Score

Top-Modelle nach Antwortzeit (Durchschnitt)

Top-Modelle nach Geschätzte verschwendete Kosten