Ranglijst voor Anti-AI-trucs x Verkeerd antwoord

Zie welke AI-modellen op Anti-AI-trucs het meest kans hebben op Verkeerd antwoord, zodat je zwakke punten sneller ziet.

Getoonde modellen

Totaal fouten

293

Meest getroffen model

Seed-2.0-Lite 4

Foutredenen

Verkeerd antwoord293 Instructies niet gevolgd33 Extra opmaak20 API-fout14 Geen antwoord4 Time-out4

Categorieën

Domeinspecifiek412 Anti-AI-trucs293 Programmeren252 Puzzeloplossing201 Algemene kennis168 Gecombineerd68 Instructies opvolgen61 Algemene intelligentie59 Gegevensparsering en extractie41 Toolaanroepen3

140/140

Rang	Model	Bedrijf	Verkeerd antwoord-aantal	Categoriescore	Totale kosten	Correcte tests	Responstijd (gem.)
#132	GPT-5.6 Terra none	OpenAI	3	4.8	$0.349	1/4	942ms
Totaal tests 4 Foute tests 3 Totale kosten $0.349 Responstijd (gem.) 942ms
#138	Kimi K2.6 none	Moonshot AI	3	4.6	$0.184	1/4	1.39s
Totaal tests 4 Foute tests 3 Totale kosten $0.184 Responstijd (gem.) 1.39s
#141	GLM 5 none	Z.ai	3	4.8	$0.041	1/4	2.37s
Totaal tests 4 Foute tests 3 Totale kosten $0.041 Responstijd (gem.) 2.37s
#142	Qwen3.5-122B-A10B none	Qwen	3	4.8	$0.247	1/4	1.59s
Totaal tests 4 Foute tests 3 Totale kosten $0.247 Responstijd (gem.) 1.59s
#145	GLM 5V Turbo none	Z.ai	3	4.8	$0.052	1/4	3.13s
Totaal tests 4 Foute tests 3 Totale kosten $0.052 Responstijd (gem.) 3.13s
#146	Owl Alpha medium	Openrouter	3	4.8	$0.000	1/4	3.97s
Totaal tests 4 Foute tests 3 Totale kosten $0.000 Responstijd (gem.) 3.97s
#148	Owl Alpha none	Openrouter	3	3.4	$0.000	0/4	2.78s
Totaal tests 4 Foute tests 4 Totale kosten $0.000 Responstijd (gem.) 2.78s
#154	MiMo-V2.5-Pro none	Xiaomi	3	3.3	$0.068	0/4	2.67s
Totaal tests 4 Foute tests 4 Totale kosten $0.068 Responstijd (gem.) 2.67s
#157	Mimo V2 Omni none	Xiaomi	3	3.6	$0.021	0/4	1.63s
Totaal tests 4 Foute tests 4 Totale kosten $0.021 Responstijd (gem.) 1.63s
#159	GPT-5.6 Luna none	OpenAI	3	4.8	$0.142	1/4	901ms
Totaal tests 4 Foute tests 3 Totale kosten $0.142 Responstijd (gem.) 901ms
#164	Inkling none	Thinkingmachines	3	4.8	$0.147	1/4	1.43s
Totaal tests 4 Foute tests 3 Totale kosten $0.147 Responstijd (gem.) 1.43s
#167	Mistral Small 4 medium	Mistral	3	5.6	$0.096	1/4	2.67s
Totaal tests 4 Foute tests 3 Totale kosten $0.096 Responstijd (gem.) 2.67s
#174	GPT-4o-mini none	OpenAI	3	4.8	$0.010	1/4	1.34s
Totaal tests 4 Foute tests 3 Totale kosten $0.010 Responstijd (gem.) 1.34s
#176	GLM 4.7 Flash none	Z.ai	3	5.2	$0.016	1/4	5.51s
Totaal tests 4 Foute tests 3 Totale kosten $0.016 Responstijd (gem.) 5.51s
#177	Nemotron 3 Super none	NVIDIA	3	4.8	$0.008	1/4	4.46s
Totaal tests 4 Foute tests 3 Totale kosten $0.008 Responstijd (gem.) 4.46s

Modellen filteren

Topmodellen op Verkeerd antwoord-aantal

Verkeerd antwoord-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten

Anti-AI-trucs: Verkeerd antwoord

Modellen filteren

Topmodellen op Verkeerd antwoord-aantal

Verkeerd antwoord-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten