AI BENCHY Kategoriefehler
Kombiniert: Keine Antwort
Kombiniert
Keine Antwort
Sieh, welche KI-Modelle bei Kombiniert am ehesten auf Keine Antwort stoßen, damit du Schwachstellen schneller erkennst. Sortieren nach: Fehleranzahl ↑.
Fehlergründe
| Rang | Modell | Unternehmen | Keine Antwort-Anzahl | Kategorie-Score | Korrekte Tests | Antwortzeit (Durchschnitt) |
|---|---|---|---|---|---|---|
| #66 | Qwen3.5-35B-A3B medium | Qwen | 1 | 4.7 | 0/1 | 75.3s |
| #92 | Laguna M.1 medium | Poolside | 1 | 3.0 | 0/1 | 53.1s |