AI BENCHY
Advertise here

AI BENCHY Kategoriefehler

Rätsellösen: Zusätzliche Formatierung

Rätsellösen
Zusätzliche Formatierung

Sieh, welche KI-Modelle bei Rätsellösen am ehesten auf Zusätzliche Formatierung stoßen, damit du Schwachstellen schneller erkennst. Sortieren nach: Korrekte Tests ↓.

Angezeigte Modelle

5

Gesamtfehler

5

Am stärksten betroffenes Modell

Claude Opus 4.8 1
Rang Modell Unternehmen Zusätzliche Formatierung-Anzahl Kategorie-Score Korrekte Tests Antwortzeit (Durchschnitt)
#68 Claude Opus 4.8 none Anthropic 1 7.7 2/3 2.74s
#77 Claude Sonnet 4.6 none Anthropic 1 7.7 2/3 2.53s
#113 DeepSeek V4 Pro none DeepSeek 1 7.6 2/3 16.0s
#51 Mimo V2 PRO medium Xiaomi 1 6.4 1/3 5.08s
#139 DeepSeek V4 Flash none DeepSeek 1 3.1 0/3 23.7s

Top-Modelle nach Zusätzliche Formatierung-Anzahl

Zusätzliche Formatierung-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)

Top-Modelle nach Geschätzte verschwendete Kosten