Ranking für Anti-KI-Tricks x Zusätzliche Formatierung

Sieh, welche KI-Modelle bei Anti-KI-Tricks am ehesten auf Zusätzliche Formatierung stoßen, damit du Schwachstellen schneller erkennst. Sortieren nach: Korrekte Tests ↑.

Angezeigte Modelle

Gesamtfehler

Am stärksten betroffenes Modell

DeepSeek V4 Pro 1

Fehlergründe

Falsche Antwort293 Anweisungen nicht befolgt33 Zusätzliche Formatierung20 API-Fehler14 Keine Antwort4 Zeitüberschreitung4

Kategorien

Anti-KI-Tricks20 Programmierung18 Domänenspezifisch17 Rätsellösen8 Datenanalyse und -extraktion6 Befolgung von Anweisungen3 Kombiniert1

14/14

Rang	Modell	Unternehmen	Zusätzliche Formatierung-Anzahl	Kategorie-Score	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#82	DeepSeek V4 Pro none	DeepSeek	1	3.2	$0.096	0/4	4.02s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.096 Antwortzeit (Durchschnitt) 4.02s
#166	Qwen3 Coder Next none	Qwen	1	3.6	$0.025	0/4	3.31s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.025 Antwortzeit (Durchschnitt) 3.31s
#171	North Mini Code none	Cohere	2	3.0	$0.000	0/4	22.5s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.000 Antwortzeit (Durchschnitt) 22.5s
#173	DeepSeek V3.2 none	DeepSeek	2	3.2	$0.054	0/4	9.35s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.054 Antwortzeit (Durchschnitt) 9.35s
#63	Claude Sonnet 4.6 none	Anthropic	2	4.8	$0.661	1/4	2.94s
Gesamttests 4 Falsche Tests 3 Gesamtkosten $0.661 Antwortzeit (Durchschnitt) 2.94s
#112	Claude Sonnet 5 none	Anthropic	2	5.3	$0.548	1/4	3.60s
Gesamttests 4 Falsche Tests 3 Gesamtkosten $0.548 Antwortzeit (Durchschnitt) 3.60s
#40	Claude Sonnet 4.6 medium	Anthropic	1	6.5	$2.057	2/4	2.98s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $2.057 Antwortzeit (Durchschnitt) 2.98s
#43	Claude Opus 4.6 medium	Anthropic	2	6.4	$3.059	2/4	7.45s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $3.059 Antwortzeit (Durchschnitt) 7.45s
#66	Claude Opus 4.8 none	Anthropic	2	6.5	$1.166	2/4	3.40s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $1.166 Antwortzeit (Durchschnitt) 3.40s
#181	Grok 4.20 Multi Agent Beta medium	X AI	1	6.9	$5.599	2/4	3.46s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $5.599 Antwortzeit (Durchschnitt) 3.46s
#48	Grok Build 0.1 medium	X AI	1	8.3	$1.097	3/4	7.43s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $1.097 Antwortzeit (Durchschnitt) 7.43s
#58	Qwen3.5-27B medium	Qwen	1	8.7	$1.627	3/4	19.8s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $1.627 Antwortzeit (Durchschnitt) 19.8s
#113	MiMo-V2-Flash medium	Xiaomi	1	8.1	$0.043	3/4	15.8s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $0.043 Antwortzeit (Durchschnitt) 15.8s
#137	North Mini Code medium	Cohere	1	8.4	$0.000	3/4	64.8s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $0.000 Antwortzeit (Durchschnitt) 64.8s

Modelle filtern

Top-Modelle nach Zusätzliche Formatierung-Anzahl

Zusätzliche Formatierung-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)

Top-Modelle nach Geschätzte verschwendete Kosten

Anti-KI-Tricks: Zusätzliche Formatierung

Modelle filtern

Top-Modelle nach Zusätzliche Formatierung-Anzahl

Zusätzliche Formatierung-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)

Top-Modelle nach Geschätzte verschwendete Kosten