Modell-Ranking für Anti-KI-Tricks

Sieh, welche KI-Modelle bei Anti-KI-Tricks am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Metrik ↑.

Angezeigte Modelle

Durchschnittlicher Wert für Anti-KI-Tricks-Score

7.1

Bestes Modell

LFM2-24B-A2B 2.5

Fehlergründe

Mit Fehlergrund Falsche Antwort293 Mit Fehlergrund Anweisungen nicht befolgt33 Mit Fehlergrund Zusätzliche Formatierung20 Mit Fehlergrund API-Fehler14 Mit Fehlergrund Keine Antwort4 Mit Fehlergrund Zeitüberschreitung4

210/210

Rang	Modell	Unternehmen	Anti-KI-Tricks-Score	Punktzahl	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#200	MiMo-V2-Flash none	Xiaomi	3.2	4.0	$0.025	0/4	1.19s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.025 Antwortzeit (Durchschnitt) 1.19s
#82	DeepSeek V4 Pro none	DeepSeek	3.2	6.9	$0.096	0/4	4.02s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.096 Antwortzeit (Durchschnitt) 4.02s
#154	MiMo-V2.5-Pro none	Xiaomi	3.3	5.5	$0.068	0/4	2.67s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.068 Antwortzeit (Durchschnitt) 2.67s
#162	Ling-2.6-1T none	Inclusionai	3.4	5.3	$0.016	0/4	6.55s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.016 Antwortzeit (Durchschnitt) 6.55s
#127	Qwen3.5-35B-A3B none	Qwen	3.4	6.1	$0.106	0/4	1.43s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.106 Antwortzeit (Durchschnitt) 1.43s
#148	Owl Alpha none	Openrouter	3.4	5.6	$0.000	0/4	2.78s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.000 Antwortzeit (Durchschnitt) 2.78s
#165	Mistral Small 4 none	Mistral	3.4	5.1	$0.022	0/4	395ms
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.022 Antwortzeit (Durchschnitt) 395ms
#192	Laguna M.1 none	Poolside	3.4	4.4	$0.009	0/4	705ms
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.009 Antwortzeit (Durchschnitt) 705ms
#125	Qwen3.5-Flash none	Qwen	3.5	6.1	$0.073	0/4	1.32s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.073 Antwortzeit (Durchschnitt) 1.32s
#187	Qwen3 Coder Next medium	Qwen	3.5	4.7	$0.032	0/4	8.64s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.032 Antwortzeit (Durchschnitt) 8.64s
#129	Nemotron 3 Ultra none	NVIDIA	3.5	6.1	$0.095	0/4	2.35s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.095 Antwortzeit (Durchschnitt) 2.35s
#147	Mimo V2 PRO none	Xiaomi	3.5	5.6	$0.045	0/4	1.80s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.045 Antwortzeit (Durchschnitt) 1.80s
#168	MiMo-V2.5 none	Xiaomi	3.5	5.1	$0.025	0/4	2.19s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.025 Antwortzeit (Durchschnitt) 2.19s
#180	GPT-5.4 Nano none	OpenAI	3.5	4.8	$0.041	0/4	1.18s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.041 Antwortzeit (Durchschnitt) 1.18s
#196	Hunter Alpha none	OpenRouter	3.5	4.2	$0.000	0/4	3.81s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.000 Antwortzeit (Durchschnitt) 3.81s

Anti-KI-Tricks-Ranking

Modelle filtern

Top-Modelle nach Anti-KI-Tricks-Score

Anti-KI-Tricks-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)