Modell-Ranking für Anti-KI-Tricks

Sieh, welche KI-Modelle bei Anti-KI-Tricks am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Antwortzeit (Durchschnitt) ↓.

Angezeigte Modelle

Durchschnittlicher Wert für Anti-KI-Tricks-Score

7.1

Bestes Modell

Seed-2.0-Mini 6.6

Fehlergründe

Mit Fehlergrund Falsche Antwort293 Mit Fehlergrund Anweisungen nicht befolgt33 Mit Fehlergrund Zusätzliche Formatierung20 Mit Fehlergrund API-Fehler14 Mit Fehlergrund Keine Antwort4 Mit Fehlergrund Zeitüberschreitung4

210/210

Rang	Modell	Unternehmen	Anti-KI-Tricks-Score	Punktzahl	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#80	Seed-2.0-Mini medium	Bytedance Seed	6.6	7.0	$0.101	2/4	74.7s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.101 Antwortzeit (Durchschnitt) 74.7s
#137	North Mini Code medium	Cohere	8.4	5.9	$0.000	3/4	64.8s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $0.000 Antwortzeit (Durchschnitt) 64.8s
#114	Qwen3.5-Flash medium	Qwen	10.0	6.2	$0.139	4/4	59.1s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.139 Antwortzeit (Durchschnitt) 59.1s
#77	Kimi K2.5 medium	Moonshot AI	7.3	7.0	$0.600	2/4	51.4s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.600 Antwortzeit (Durchschnitt) 51.4s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	8.2	7.5	$0.437	3/4	45.8s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $0.437 Antwortzeit (Durchschnitt) 45.8s
#163	Gemini 3.1 Flash Lite Preview high	Google	7.5	5.3	$2.310	3/3	43.9s
Gesamttests 3 Falsche Tests 0 Gesamtkosten $2.310 Antwortzeit (Durchschnitt) 43.9s
#179	Ring-2.6-1T none	Inclusionai	9.2	4.8	$0.026	3/4	43.3s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $0.026 Antwortzeit (Durchschnitt) 43.3s
#108	Ring-2.6-1T medium	Inclusionai	10.0	6.3	$0.103	4/4	42.2s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.103 Antwortzeit (Durchschnitt) 42.2s
#102	Laguna XS 2.1 medium	Poolside	4.8	6.5	$0.068	1/4	42.0s
Gesamttests 4 Falsche Tests 3 Gesamtkosten $0.068 Antwortzeit (Durchschnitt) 42.0s
#130	Step 3.5 Flash medium	Stepfun	10.0	6.0	$0.108	4/4	40.6s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.108 Antwortzeit (Durchschnitt) 40.6s
#172	MiniMax M2.7 medium	Minimax	7.9	5.0	$0.163	2/4	40.3s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.163 Antwortzeit (Durchschnitt) 40.3s
#143	Gemini 3.1 Flash Lite high	Google	8.7	5.6	$2.044	3/4	37.2s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $2.044 Antwortzeit (Durchschnitt) 37.2s
#209	Step 3.5 Flash none	Stepfun	10.0	2.3	$0.020	4/4	35.0s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.020 Antwortzeit (Durchschnitt) 35.0s
#204	Qwen3.5-9B medium	Qwen	5.1	3.8	$0.036	1/4	34.4s
Gesamttests 4 Falsche Tests 3 Gesamtkosten $0.036 Antwortzeit (Durchschnitt) 34.4s
#206	gpt-oss-120b none	OpenAI	6.5	3.7	$0.010	2/4	32.8s
Gesamttests 4 Falsche Tests 2 Gesamtkosten $0.010 Antwortzeit (Durchschnitt) 32.8s

Anti-KI-Tricks-Ranking

Modelle filtern

Top-Modelle nach Anti-KI-Tricks-Score

Anti-KI-Tricks-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)