AI BENCHY Kategoriefehler
Befolgung von Anweisungen: Zusätzliche Formatierung
Befolgung von Anweisungen
Zusätzliche Formatierung
Sieh, welche KI-Modelle bei Befolgung von Anweisungen am ehesten auf Zusätzliche Formatierung stoßen, damit du Schwachstellen schneller erkennst. Sortieren nach: Antwortzeit (Durchschnitt) ↑.
Fehlergründe
| Rang | Modell | Unternehmen | Zusätzliche Formatierung-Anzahl | Kategorie-Score | Korrekte Tests | Antwortzeit (Durchschnitt) |
|---|---|---|---|---|---|---|
| #108 | HY3 Preview none | Tencent | 1 | 6.3 | 1/2 | 13.0s |
| #92 | DeepSeek V4 Flash none | DeepSeek | 1 | 6.5 | 1/2 | 17.5s |