AI BENCHY Kategoriefehler
Anti-KI-Tricks: Anweisungen nicht befolgt
Anti-KI-Tricks
Anweisungen nicht befolgt
Sieh, welche KI-Modelle bei Anti-KI-Tricks am ehesten auf Anweisungen nicht befolgt stoßen, damit du Schwachstellen schneller erkennst.
Angezeigte Modelle
2
Gesamtfehler
17
Am stärksten betroffenes Modell
Gemini 3.1 Flash Lite Preview 1Fehlergründe
| Rang | Modell | Unternehmen | Anweisungen nicht befolgt-Anzahl | Kategorie-Score | Korrekte Tests | Antwortzeit (Durchschnitt) |
|---|---|---|---|---|---|---|
| #93 | GLM 4.7 Flash medium | Z.ai | 1 | 4.7 | 1/4 | 15.0s |
| #95 | Grok 4.1 Fast none | X AI | 1 | 3.2 | 0/4 | 1.07s |