Modell-Ranking für Anti-KI-Tricks

Sieh, welche KI-Modelle bei Anti-KI-Tricks am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Korrekte Tests ↓.

Angezeigte Modelle

Durchschnittlicher Wert für Anti-KI-Tricks-Score

7.1

Bestes Modell

Gemini 3 Flash Preview 10.0

Fehlergründe

Mit Fehlergrund Falsche Antwort293 Mit Fehlergrund Anweisungen nicht befolgt33 Mit Fehlergrund Zusätzliche Formatierung20 Mit Fehlergrund API-Fehler14 Mit Fehlergrund Keine Antwort4 Mit Fehlergrund Zeitüberschreitung4

210/210

Rang	Modell	Unternehmen	Anti-KI-Tricks-Score	Punktzahl	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#22	Grok 4.5 medium	X AI	10.0	8.3	$1.928	4/4	23.5s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $1.928 Antwortzeit (Durchschnitt) 23.5s
#23	Claude Sonnet 5 medium	Anthropic	10.0	8.3	$0.922	4/4	3.80s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.922 Antwortzeit (Durchschnitt) 3.80s
#28	Inkling high	Thinkingmachines	10.0	8.0	$1.006	4/4	12.7s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $1.006 Antwortzeit (Durchschnitt) 12.7s
#31	GLM 5.2 high	Z.ai	10.0	8.0	$0.970	4/4	5.80s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.970 Antwortzeit (Durchschnitt) 5.80s
#33	Kimi K3 max	Moonshot AI	10.0	8.0	$3.112	4/4	10.2s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $3.112 Antwortzeit (Durchschnitt) 10.2s
#36	Qwen3.7 Plus medium	Qwen	10.0	7.9	$0.267	4/4	8.58s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.267 Antwortzeit (Durchschnitt) 8.58s
#37	Qwen3.6 Plus medium	Qwen	10.0	7.8	$0.405	4/4	9.90s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.405 Antwortzeit (Durchschnitt) 9.90s
#38	GLM 5.2 medium	Z.ai	10.0	7.8	$0.222	4/4	5.89s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.222 Antwortzeit (Durchschnitt) 5.89s
#41	Claude Opus 4.8 low	Anthropic	10.0	7.8	$2.077	4/4	3.30s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $2.077 Antwortzeit (Durchschnitt) 3.30s
#42	GLM 5 medium	Z.ai	10.0	7.7	$0.307	4/4	23.7s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.307 Antwortzeit (Durchschnitt) 23.7s
#49	GLM 5 Turbo medium	Z.ai	10.0	7.6	$0.323	4/4	4.82s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.323 Antwortzeit (Durchschnitt) 4.82s
#51	Nemotron 3 Ultra medium	NVIDIA	10.0	7.5	$0.774	4/4	8.62s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.774 Antwortzeit (Durchschnitt) 8.62s
#60	LongCat 2.0 medium	Meituan	10.0	7.4	$0.478	4/4	9.65s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.478 Antwortzeit (Durchschnitt) 9.65s
#61	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.177	4/4	3.48s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.177 Antwortzeit (Durchschnitt) 3.48s
#70	Qwen3.5 Plus 2026-04-20 medium	Qwen	10.0	7.2	$0.317	4/4	10.8s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.317 Antwortzeit (Durchschnitt) 10.8s

Anti-KI-Tricks-Ranking

Modelle filtern

Top-Modelle nach Anti-KI-Tricks-Score

Anti-KI-Tricks-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)