AI BENCHY
Vergleichen Diagramme Methodik
❤️ Made by XCS
Your ad here

AI BENCHY Kategoriefehler

Anti-KI-Tricks
Zusätzliche Formatierung

Sieh, welche KI-Modelle bei Anti-KI-Tricks am ehesten auf Zusätzliche Formatierung stoßen, damit du Schwachstellen schneller erkennst. Sortieren nach: Antwortzeit (Durchschnitt) ↑.

Angezeigte Modelle

5

Gesamtfehler

8

Am stärksten betroffenes Modell

Qwen3 Coder Next 1
Rang Modell Unternehmen Zusätzliche Formatierung-Anzahl Kategorie-Score Korrekte Tests Antwortzeit (Durchschnitt)
#48 Qwen3 Coder Next none Qwen 1 2.3 0/3 4.39s
#25 Claude Sonnet 4.6 none Anthropic 2 4.0 1/3 4.83s
#11 Claude Sonnet 4.6 medium Anthropic 1 7.0 2/3 4.95s
#33 DeepSeek V3.2 none DeepSeek 2 10.0 0/3 8.79s
#26 Claude Opus 4.6 medium Anthropic 2 4.0 1/3 11.9s

Top-Modelle nach Zusätzliche Formatierung-Anzahl

Zusätzliche Formatierung-Anzahl vs. Ø-Score

Top-Modelle nach Antwortzeit (Durchschnitt)

Top-Modelle nach Geschätzte verschwendete Kosten