Modell-Ranking für Anti-KI-Tricks

Sieh, welche KI-Modelle bei Anti-KI-Tricks am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Antwortzeit (Durchschnitt) ↑.

Angezeigte Modelle

Durchschnittlicher Wert für Anti-KI-Tricks-Score

7.2

Bestes Modell

Mistral Small 4 3.4

Fehlergründe

Mit Fehlergrund Falsche Antwort293 Mit Fehlergrund Anweisungen nicht befolgt33 Mit Fehlergrund Zusätzliche Formatierung20 Mit Fehlergrund API-Fehler14 Mit Fehlergrund Keine Antwort4 Mit Fehlergrund Zeitüberschreitung4

216/216

Rang	Modell	Unternehmen	Anti-KI-Tricks-Score	Punktzahl	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#67	Claude Sonnet 4.6 none	Anthropic	4.8	7.3	$0.661	1/4	2.94s
Gesamttests 4 Falsche Tests 3 Gesamtkosten $0.661 Antwortzeit (Durchschnitt) 2.94s
#44	Claude Sonnet 4.6 medium	Anthropic	6.5	7.8	$2.057	2/4	2.98s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $2.057 Antwortzeit (Durchschnitt) 2.98s
#48	GPT-5.6 Luna high	OpenAI	8.3	7.7	$1.017	3/4	2.99s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $1.017 Antwortzeit (Durchschnitt) 2.99s
#151	GLM 5V Turbo none	Z.ai	4.8	5.6	$0.052	1/4	3.13s
Gesamttests 4 Falsche Tests 3 Gesamtkosten $0.052 Antwortzeit (Durchschnitt) 3.13s
#137	Grok 4.20 Beta medium	X AI	8.7	6.0	$0.750	3/4	3.16s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $0.750 Antwortzeit (Durchschnitt) 3.16s
#73	KAT-Coder-Pro V2.5 high	Kwaipilot	7.0	7.2	$0.482	2/4	3.17s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.482 Antwortzeit (Durchschnitt) 3.17s
#88	MiMo-V2.5-Pro medium	Xiaomi	10.0	6.9	$0.187	4/4	3.26s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.187 Antwortzeit (Durchschnitt) 3.26s
#45	Claude Opus 4.8 low	Anthropic	10.0	7.8	$2.077	4/4	3.30s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $2.077 Antwortzeit (Durchschnitt) 3.30s
#172	Qwen3 Coder Next none	Qwen	3.6	5.1	$0.025	0/4	3.31s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.025 Antwortzeit (Durchschnitt) 3.31s
#8	GPT-5.6 Sol high	OpenAI	8.7	9.4	$1.234	3/4	3.39s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $1.234 Antwortzeit (Durchschnitt) 3.39s
#70	Claude Opus 4.8 none	Anthropic	6.5	7.3	$1.166	2/4	3.40s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $1.166 Antwortzeit (Durchschnitt) 3.40s
#34	GPT-5.2 Chat none	OpenAI	8.7	8.0	$0.604	3/4	3.40s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $0.604 Antwortzeit (Durchschnitt) 3.40s
#187	Grok 4.20 Multi Agent Beta medium	X AI	6.9	4.8	$5.599	2/4	3.46s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $5.599 Antwortzeit (Durchschnitt) 3.46s
#65	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.177	4/4	3.48s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.177 Antwortzeit (Durchschnitt) 3.48s
#164	KAT-Coder-Air V2.5 low	Kwaipilot	7.3	5.4	$0.041	2/4	3.50s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.041 Antwortzeit (Durchschnitt) 3.50s

Anti-KI-Tricks-Ranking

Modelle filtern

Top-Modelle nach Anti-KI-Tricks-Score

Anti-KI-Tricks-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)