Modell-Ranking für Anti-KI-Tricks

Sieh, welche KI-Modelle bei Anti-KI-Tricks am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Antwortzeit (Durchschnitt) ↑.

Angezeigte Modelle

Durchschnittlicher Wert für Anti-KI-Tricks-Score

7.2

Bestes Modell

Mistral Small 4 3.4

Fehlergründe

Mit Fehlergrund Falsche Antwort293 Mit Fehlergrund Anweisungen nicht befolgt33 Mit Fehlergrund Zusätzliche Formatierung20 Mit Fehlergrund API-Fehler14 Mit Fehlergrund Keine Antwort4 Mit Fehlergrund Zeitüberschreitung4

216/216

Rang	Modell	Unternehmen	Anti-KI-Tricks-Score	Punktzahl	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#153	Mimo V2 PRO none	Xiaomi	3.5	5.6	$0.045	0/4	1.80s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.045 Antwortzeit (Durchschnitt) 1.80s
#111	Gemini 3.1 Flash Lite low	Google	7.3	6.5	$0.621	2/4	1.84s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.621 Antwortzeit (Durchschnitt) 1.84s
#18	Claude Opus 4.7 medium	Anthropic	8.3	8.7	$1.477	3/4	1.85s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $1.477 Antwortzeit (Durchschnitt) 1.85s
#121	Gemma 4 31B none	Google	6.5	6.2	$0.021	2/4	1.85s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.021 Antwortzeit (Durchschnitt) 1.85s
#132	Qwen3.5 Plus 2026-04-20 none	Qwen	4.8	6.1	$0.122	1/4	1.88s
Gesamttests 4 Falsche Tests 3 Gesamtkosten $0.122 Antwortzeit (Durchschnitt) 1.88s
#113	Qwen3.5 Plus 2026-02-15 none	Qwen	4.8	6.4	$0.073	1/4	1.91s
Gesamttests 4 Falsche Tests 3 Gesamtkosten $0.073 Antwortzeit (Durchschnitt) 1.91s
#31	Gemini 3.5 Flash-Lite high	Google	10.0	8.1	$0.584	4/4	1.98s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.584 Antwortzeit (Durchschnitt) 1.98s
#189	Trinity Large Preview none	Arcee AI	3.1	4.8	$0.008	0/4	2.07s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.008 Antwortzeit (Durchschnitt) 2.07s
#12	Gemini 3.5 Flash medium	Google	10.0	9.1	$0.642	4/4	2.09s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.642 Antwortzeit (Durchschnitt) 2.09s
#167	Qwen3.6 35B A3B none	Qwen	3.6	5.3	$0.061	0/4	2.10s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.061 Antwortzeit (Durchschnitt) 2.10s
#157	GLM 5.1 none	Z.ai	4.0	5.5	$0.164	0/4	2.11s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.164 Antwortzeit (Durchschnitt) 2.11s
#110	Gemini 3.1 Flash Lite Preview low	Google	8.3	6.5	$0.646	3/4	2.12s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $0.646 Antwortzeit (Durchschnitt) 2.12s
#99	Claude Opus 4.7 none	Anthropic	8.3	6.6	$0.505	3/4	2.12s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $0.505 Antwortzeit (Durchschnitt) 2.12s
#174	MiMo-V2.5 none	Xiaomi	3.5	5.1	$0.025	0/4	2.19s
Gesamttests 4 Falsche Tests 4 Gesamtkosten $0.025 Antwortzeit (Durchschnitt) 2.19s
#123	GPT-5.6 Luna low	OpenAI	8.3	6.2	$0.249	3/4	2.21s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $0.249 Antwortzeit (Durchschnitt) 2.21s

Anti-KI-Tricks-Ranking

Modelle filtern

Top-Modelle nach Anti-KI-Tricks-Score

Anti-KI-Tricks-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)