Modell-Ranking für Anti-KI-Tricks

Sieh, welche KI-Modelle bei Anti-KI-Tricks am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Korrekte Tests ↑.

Angezeigte Modelle

Durchschnittlicher Wert für Anti-KI-Tricks-Score

7.1

Bestes Modell

DeepSeek V4 Pro 3.2

Fehlergründe

Mit Fehlergrund Falsche Antwort293 Mit Fehlergrund Anweisungen nicht befolgt33 Mit Fehlergrund Zusätzliche Formatierung20 Mit Fehlergrund API-Fehler14 Mit Fehlergrund Keine Antwort4 Mit Fehlergrund Zeitüberschreitung4

210/210

Rang	Modell	Unternehmen	Anti-KI-Tricks-Score	Punktzahl	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#82	DeepSeek V4 Pro none	DeepSeek	3.2	6.9	$0.096	0/4	4.02s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.096 Antwortzeit (Durchschnitt) 4.02s
#116	Seed-2.0-Lite none	Bytedance Seed	3.0	6.2	$0.066	0/4	2.43s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.066 Antwortzeit (Durchschnitt) 2.43s
#118	Gemini 2.5 Flash none	Google	3.0	6.2	$0.017	0/4	582ms
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.017 Antwortzeit (Durchschnitt) 582ms
#124	Qwen3.6 Flash none	Qwen	3.1	6.1	$0.062	0/4	1.63s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.062 Antwortzeit (Durchschnitt) 1.63s
#125	Qwen3.5-Flash none	Qwen	3.5	6.1	$0.073	0/4	1.32s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.073 Antwortzeit (Durchschnitt) 1.32s
#127	Qwen3.5-35B-A3B none	Qwen	3.4	6.1	$0.106	0/4	1.43s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.106 Antwortzeit (Durchschnitt) 1.43s
#129	Nemotron 3 Ultra none	NVIDIA	3.5	6.1	$0.095	0/4	2.35s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.095 Antwortzeit (Durchschnitt) 2.35s
#136	GPT-5.4 Mini none	OpenAI	3.1	5.9	$0.095	0/4	929ms
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.095 Antwortzeit (Durchschnitt) 929ms
#139	GPT-5.4 none	OpenAI	3.2	5.8	$0.397	0/4	1.21s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.397 Antwortzeit (Durchschnitt) 1.21s
#147	Mimo V2 PRO none	Xiaomi	3.5	5.6	$0.045	0/4	1.80s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.045 Antwortzeit (Durchschnitt) 1.80s
#148	Owl Alpha none	Openrouter	3.4	5.6	$0.000	0/4	2.78s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.000 Antwortzeit (Durchschnitt) 2.78s
#150	DeepSeek V4 Flash none	DeepSeek	3.0	5.6	$0.044	0/4	20.2s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.044 Antwortzeit (Durchschnitt) 20.2s
#151	GLM 5.1 none	Z.ai	4.0	5.5	$0.164	0/4	2.11s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.164 Antwortzeit (Durchschnitt) 2.11s
#152	Qwen3.6 27B none	Qwen	3.8	5.5	$0.087	0/4	2.83s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.087 Antwortzeit (Durchschnitt) 2.83s
#154	MiMo-V2.5-Pro none	Xiaomi	3.3	5.5	$0.068	0/4	2.67s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.068 Antwortzeit (Durchschnitt) 2.67s

Anti-KI-Tricks-Ranking

Modelle filtern

Top-Modelle nach Anti-KI-Tricks-Score

Anti-KI-Tricks-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)