AI BENCHY Kategoriefehler
Befolgung von Anweisungen: API-Fehler
Befolgung von Anweisungen
API-Fehler
Sieh, welche KI-Modelle bei Befolgung von Anweisungen am ehesten auf API-Fehler stoßen, damit du Schwachstellen schneller erkennst. Sortieren nach: Korrekte Tests ↓.
Fehlergründe
| Rang | Modell | Unternehmen | API-Fehler-Anzahl | Kategorie-Score | Korrekte Tests | Antwortzeit (Durchschnitt) |
|---|---|---|---|---|---|---|
| #93 | Qwen3.6 Plus Preview medium | Qwen | 1 | 6.5 | 1/2 | 3.40s |