AI BENCHY Kategoriefehler
Kombiniert: Anweisungen nicht befolgt
Kombiniert
Anweisungen nicht befolgt
Sieh, welche KI-Modelle bei Kombiniert am ehesten auf Anweisungen nicht befolgt stoßen, damit du Schwachstellen schneller erkennst. Sortieren nach: Korrekte Tests ↓.
Fehlergründe
| Rang | Modell | Unternehmen | Anweisungen nicht befolgt-Anzahl | Kategorie-Score | Korrekte Tests | Antwortzeit (Durchschnitt) |
|---|---|---|---|---|---|---|
| #81 | MiMo-V2.5-Pro none | Xiaomi | 1 | 3.0 | 0/1 | 3.54s |