AI BENCHY Kategoriefehler
Domänenspezifisch: Anweisungen nicht befolgt
Domänenspezifisch
Anweisungen nicht befolgt
Sieh, welche KI-Modelle bei Domänenspezifisch am ehesten auf Anweisungen nicht befolgt stoßen, damit du Schwachstellen schneller erkennst. Sortieren nach: Korrekte Tests ↓.
Fehlergründe
| Rang | Modell | Unternehmen | Anweisungen nicht befolgt-Anzahl | Kategorie-Score | Korrekte Tests | Antwortzeit (Durchschnitt) |
|---|---|---|---|---|---|---|
| #82 | Grok Build 0.1 none | X AI | 1 | 3.6 | 0/3 | 103.7s |