Modell-Ranking für Anti-KI-Tricks

Sieh, welche KI-Modelle bei Anti-KI-Tricks am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Korrekte Tests ↓.

Angezeigte Modelle

Durchschnittlicher Wert für Anti-KI-Tricks-Score

7.2

Bestes Modell

Gemini 3.6 Flash 10.0

Fehlergründe

Mit Fehlergrund Falsche Antwort293 Mit Fehlergrund Anweisungen nicht befolgt33 Mit Fehlergrund Zusätzliche Formatierung20 Mit Fehlergrund API-Fehler14 Mit Fehlergrund Keine Antwort4 Mit Fehlergrund Zeitüberschreitung4

216/216

Rang	Modell	Unternehmen	Anti-KI-Tricks-Score	Punktzahl	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#104	Gemini 3.5 Flash-Lite medium	Google	10.0	6.5	$0.369	4/4	1.70s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.369 Antwortzeit (Durchschnitt) 1.70s
#106	Hy3 preview medium	Tencent	10.0	6.5	$0.018	4/4	6.59s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.018 Antwortzeit (Durchschnitt) 6.59s
#107	MiMo-V2.5 medium	Xiaomi	10.0	6.5	$0.082	4/4	4.14s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.082 Antwortzeit (Durchschnitt) 4.14s
#114	Ring-2.6-1T medium	Inclusionai	10.0	6.3	$0.103	4/4	42.2s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.103 Antwortzeit (Durchschnitt) 42.2s
#115	Mimo V2 PRO medium	Xiaomi	10.0	6.3	$0.333	4/4	2.86s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.333 Antwortzeit (Durchschnitt) 2.86s
#116	Gemma 4 31B medium	Google	10.0	6.3	$0.107	4/4	12.9s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.107 Antwortzeit (Durchschnitt) 12.9s
#120	Qwen3.5-Flash medium	Qwen	10.0	6.2	$0.139	4/4	59.1s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.139 Antwortzeit (Durchschnitt) 59.1s
#125	Qwen3.5-35B-A3B medium	Qwen	10.0	6.2	$0.837	4/4	21.1s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.837 Antwortzeit (Durchschnitt) 21.1s
#136	Step 3.5 Flash medium	Stepfun	10.0	6.0	$0.108	4/4	40.6s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.108 Antwortzeit (Durchschnitt) 40.6s
#139	Gemini 3 PRO Preview medium	Google	10.0	6.0	$0.385	4/4	15.0s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.385 Antwortzeit (Durchschnitt) 15.0s
#140	Mimo V2 Omni medium	Xiaomi	10.0	5.9	$0.683	4/4	2.75s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.683 Antwortzeit (Durchschnitt) 2.75s
#169	Gemini 3.1 Flash Lite Preview high	Google	7.5	5.3	$2.310	3/3	43.9s
Gesamttests 3 Falsche Tests 0 Gesamtkosten $2.310 Antwortzeit (Durchschnitt) 43.9s
#215	Step 3.5 Flash none	Stepfun	10.0	2.3	$0.020	4/4	35.0s
Gesamttests 4 Falsche Tests 0 Gesamtkosten $0.020 Antwortzeit (Durchschnitt) 35.0s
#5	GPT-5.6 Sol low	OpenAI	8.3	9.5	$0.971	3/4	2.60s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $0.971 Antwortzeit (Durchschnitt) 2.60s
#8	GPT-5.6 Sol high	OpenAI	8.7	9.4	$1.234	3/4	3.39s
Gesamttests 4 Falsche Tests 1 Gesamtkosten $1.234 Antwortzeit (Durchschnitt) 3.39s

Anti-KI-Tricks-Ranking

Modelle filtern

Top-Modelle nach Anti-KI-Tricks-Score

Anti-KI-Tricks-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)