AI BENCHY
Advertise here

AI BENCHY Kategoriefehler

Kombiniert: Anweisungen nicht befolgt

Kombiniert
Anweisungen nicht befolgt

Sieh, welche KI-Modelle bei Kombiniert am ehesten auf Anweisungen nicht befolgt stoßen, damit du Schwachstellen schneller erkennst. Sortieren nach: Korrekte Tests ↑.

Angezeigte Modelle

1

Gesamtfehler

1

Am stärksten betroffenes Modell

MiMo-V2.5-Pro 1
1/1
Rang Modell Unternehmen Anweisungen nicht befolgt-Anzahl Kategorie-Score Gesamtkosten Korrekte Tests Antwortzeit (Durchschnitt)

Top-Modelle nach Anweisungen nicht befolgt-Anzahl

Anweisungen nicht befolgt-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)

Top-Modelle nach Geschätzte verschwendete Kosten