AI BENCHY
Advertise here

AI BENCHY Kategoriefehler

Allgemeinwissen: Falsche Antwort

Allgemeinwissen
Falsche Antwort

Sieh, welche KI-Modelle bei Allgemeinwissen am ehesten auf Falsche Antwort stoßen, damit du Schwachstellen schneller erkennst.

Angezeigte Modelle

13

Gesamtfehler

133

Am stärksten betroffenes Modell

Qwen3.7 Max 1
133/133
Rang Modell Unternehmen Falsche Antwort-Anzahl Kategorie-Score Gesamtkosten Korrekte Tests Antwortzeit (Durchschnitt)

Top-Modelle nach Falsche Antwort-Anzahl

Falsche Antwort-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)

Top-Modelle nach Geschätzte verschwendete Kosten