Modell-Ranking für Anti-KI-Tricks

Sieh, welche KI-Modelle bei Anti-KI-Tricks am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen.

Angezeigte Modelle

Durchschnittlicher Wert für Anti-KI-Tricks-Score

7.2

Bestes Modell

Gemini 3.6 Flash 10.0

Fehlergründe

Mit Fehlergrund Falsche Antwort293 Mit Fehlergrund Anweisungen nicht befolgt33 Mit Fehlergrund Zusätzliche Formatierung20 Mit Fehlergrund API-Fehler14 Mit Fehlergrund Keine Antwort4 Mit Fehlergrund Zeitüberschreitung4

216/216

Rang	Modell	Unternehmen	Anti-KI-Tricks-Score	Punktzahl	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#98	GLM 5V Turbo medium	Z.ai	7.2	6.7	$0.457	2/4	10.8s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.457 Antwortzeit (Durchschnitt) 10.8s
#29	GPT-5 Mini medium	OpenAI	7.1	8.1	$0.237	2/4	13.9s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.237 Antwortzeit (Durchschnitt) 13.9s
#72	Kimi K2.6 medium	Moonshot AI	7.0	7.2	$1.036	2/4	11.6s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $1.036 Antwortzeit (Durchschnitt) 11.6s
#73	KAT-Coder-Pro V2.5 high	Kwaipilot	7.0	7.2	$0.482	2/4	3.17s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.482 Antwortzeit (Durchschnitt) 3.17s
#91	GPT-5.5 none	OpenAI	6.9	6.9	$0.544	2/4	1.31s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.544 Antwortzeit (Durchschnitt) 1.31s
#204	Laguna Xs.2 medium	Poolside	6.9	4.1	$0.015	2/4	2.68s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.015 Antwortzeit (Durchschnitt) 2.68s
#66	KAT-Coder-Pro V2.5 low	Kwaipilot	6.9	7.4	$0.387	2/4	4.20s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.387 Antwortzeit (Durchschnitt) 4.20s
#82	Mercury 2 medium	Inception	6.9	7.0	$0.093	2/4	1.12s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.093 Antwortzeit (Durchschnitt) 1.12s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	6.9	5.6	$0.077	2/4	2.49s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.077 Antwortzeit (Durchschnitt) 2.49s
#187	Grok 4.20 Multi Agent Beta medium	X AI	6.9	4.8	$5.599	2/4	3.46s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $5.599 Antwortzeit (Durchschnitt) 3.46s
#184	Ling-2.6-flash none	Inclusionai	6.8	4.9	$0.002	2/4	11.8s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.002 Antwortzeit (Durchschnitt) 11.8s
#58	GPT-5.3 Chat none	OpenAI	6.7	7.5	$0.571	2/4	3.86s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.571 Antwortzeit (Durchschnitt) 3.86s
#127	gpt-oss-120b medium	OpenAI	6.7	6.1	$0.019	2/4	10.2s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.019 Antwortzeit (Durchschnitt) 10.2s
#84	Seed-2.0-Mini medium	Bytedance Seed	6.6	7.0	$0.101	2/4	74.7s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.101 Antwortzeit (Durchschnitt) 74.7s
#199	Elephant Alpha none	Openrouter	6.6	4.3	$0.000	2/4	963ms
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.000 Antwortzeit (Durchschnitt) 963ms

Anti-KI-Tricks-Ranking

Modelle filtern

Top-Modelle nach Anti-KI-Tricks-Score

Anti-KI-Tricks-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)