Modell-Ranking für Anti-KI-Tricks

Sieh, welche KI-Modelle bei Anti-KI-Tricks am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen.

Angezeigte Modelle

Durchschnittlicher Wert für Anti-KI-Tricks-Score

7.1

Bestes Modell

Gemini 3 Flash Preview 10.0

Fehlergründe

Mit Fehlergrund Falsche Antwort293 Mit Fehlergrund Anweisungen nicht befolgt33 Mit Fehlergrund Zusätzliche Formatierung20 Mit Fehlergrund API-Fehler14 Mit Fehlergrund Keine Antwort4 Mit Fehlergrund Zeitüberschreitung4

210/210

Rang	Modell	Unternehmen	Anti-KI-Tricks-Score	Punktzahl	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#114	Qwen3.5-Flash medium	Qwen	10.0	6.2	$0.139	4/4	59.1s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.139 Antwortzeit (Durchschnitt) 59.1s
#119	Qwen3.5-35B-A3B medium	Qwen	10.0	6.2	$0.837	4/4	21.1s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.837 Antwortzeit (Durchschnitt) 21.1s
#130	Step 3.5 Flash medium	Stepfun	10.0	6.0	$0.108	4/4	40.6s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.108 Antwortzeit (Durchschnitt) 40.6s
#133	Gemini 3 PRO Preview medium	Google	10.0	6.0	$0.385	4/4	15.0s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.385 Antwortzeit (Durchschnitt) 15.0s
#134	Mimo V2 Omni medium	Xiaomi	10.0	5.9	$0.683	4/4	2.75s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.683 Antwortzeit (Durchschnitt) 2.75s
#209	Step 3.5 Flash none	Stepfun	10.0	2.3	$0.020	4/4	35.0s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.020 Antwortzeit (Durchschnitt) 35.0s
#179	Ring-2.6-1T none	Inclusionai	9.2	4.8	$0.026	3/4	43.3s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $0.026 Antwortzeit (Durchschnitt) 43.3s
#65	Gemini 3.1 Flash Lite medium	Google	9.1	7.3	$0.117	3/4	2.39s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $0.117 Antwortzeit (Durchschnitt) 2.39s
#64	Gemini 3.1 Flash Lite Preview medium	Google	9.1	7.3	$0.115	3/4	2.33s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $0.115 Antwortzeit (Durchschnitt) 2.33s
#97	LongCat 2.0 high	Meituan	8.9	6.6	$0.469	3/4	7.76s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $0.469 Antwortzeit (Durchschnitt) 7.76s
#149	KAT-Coder-Air V2.5 medium	Kwaipilot	8.7	5.6	$0.048	3/4	3.79s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $0.048 Antwortzeit (Durchschnitt) 3.79s
#5	GPT-5.6 Sol high	OpenAI	8.7	9.4	$1.234	3/4	3.39s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $1.234 Antwortzeit (Durchschnitt) 3.39s
#13	GPT-5.3-Codex medium	OpenAI	8.7	8.9	$0.920	3/4	4.16s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $0.920 Antwortzeit (Durchschnitt) 4.16s
#29	Step 3.7 Flash medium	Stepfun	8.7	8.0	$0.515	3/4	9.65s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $0.515 Antwortzeit (Durchschnitt) 9.65s
#30	GPT-5.2 Chat none	OpenAI	8.7	8.0	$0.604	3/4	3.40s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $0.604 Antwortzeit (Durchschnitt) 3.40s

Anti-KI-Tricks-Ranking

Modelle filtern

Top-Modelle nach Anti-KI-Tricks-Score

Anti-KI-Tricks-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)