AI BENCHY Kategoriefehler
Befolgung von Anweisungen: API-Fehler
Befolgung von Anweisungen
API-Fehler
Sieh, welche KI-Modelle bei Befolgung von Anweisungen am ehesten auf API-Fehler stoßen, damit du Schwachstellen schneller erkennst. Sortieren nach: Korrekte Tests ↓.
| Rang | Modell | Unternehmen | API-Fehler-Anzahl | Kategorie-Score | Korrekte Tests | Antwortzeit (Durchschnitt) |
|---|---|---|---|---|---|---|
| #47 | Grok 4.20 medium | X AI | 1 | 7.3 | 1/2 | 4.42s |