Ranglijst voor Anti-AI-trucs x Verkeerd antwoord

Zie welke AI-modellen op Anti-AI-trucs het meest kans hebben op Verkeerd antwoord, zodat je zwakke punten sneller ziet.

Getoonde modellen

Totaal fouten

293

Meest getroffen model

Seed-2.0-Lite 4

Foutredenen

Verkeerd antwoord293 Instructies niet gevolgd33 Extra opmaak20 API-fout14 Geen antwoord4 Time-out4

Categorieën

Domeinspecifiek421 Anti-AI-trucs293 Programmeren259 Puzzeloplossing204 Algemene kennis172 Gecombineerd69 Algemene intelligentie62 Instructies opvolgen61 Gegevensparsering en extractie41 Toolaanroepen3

140/140

Rang	Model	Bedrijf	Verkeerd antwoord-aantal	Categoriescore	Totale kosten	Correcte tests	Responstijd (gem.)
#91	GPT-5.5 none	OpenAI	2	6.9	$0.544	2/4	1.31s
Totaal tests 4 Foute tests 2 Totale kosten $0.544 Responstijd (gem.) 1.31s
#92	Gemini 3.5 Flash minimal	Google	2	6.5	$0.300	2/4	892ms
Totaal tests 4 Foute tests 2 Totale kosten $0.300 Responstijd (gem.) 892ms
#108	Laguna XS 2.1 medium	Poolside	2	4.8	$0.068	1/4	42.0s
Totaal tests 4 Foute tests 3 Totale kosten $0.068 Responstijd (gem.) 42.0s
#111	Gemini 3.1 Flash Lite low	Google	2	7.3	$0.621	2/4	1.84s
Totaal tests 4 Foute tests 2 Totale kosten $0.621 Responstijd (gem.) 1.84s
#121	Gemma 4 31B none	Google	2	6.5	$0.021	2/4	1.85s
Totaal tests 4 Foute tests 2 Totale kosten $0.021 Responstijd (gem.) 1.85s
#128	Gemini 3.1 Flash Lite none	Google	2	7.5	$0.046	2/4	1.07s
Totaal tests 4 Foute tests 2 Totale kosten $0.046 Responstijd (gem.) 1.07s
#134	GPT-5 Nano medium	OpenAI	2	6.5	$0.114	2/4	25.5s
Totaal tests 4 Foute tests 2 Totale kosten $0.114 Responstijd (gem.) 25.5s
#164	KAT-Coder-Air V2.5 low	Kwaipilot	2	7.3	$0.041	2/4	3.50s
Totaal tests 4 Foute tests 2 Totale kosten $0.041 Responstijd (gem.) 3.50s
#166	Laguna XS 2.1 none	Poolside	2	5.3	$0.008	1/4	755ms
Totaal tests 4 Foute tests 3 Totale kosten $0.008 Responstijd (gem.) 755ms
#172	Qwen3 Coder Next none	Qwen	2	3.6	$0.025	0/4	3.31s
Totaal tests 4 Foute tests 4 Totale kosten $0.025 Responstijd (gem.) 3.31s
#177	North Mini Code none	Cohere	2	3.0	$0.000	0/4	22.5s
Totaal tests 4 Foute tests 4 Totale kosten $0.000 Responstijd (gem.) 22.5s
#190	Hunter Alpha medium	OpenRouter	2	7.3	$0.000	2/4	4.75s
Totaal tests 4 Foute tests 2 Totale kosten $0.000 Responstijd (gem.) 4.75s
#200	GLM 4.7 Flash medium	Z.ai	2	4.7	$0.166	1/4	15.0s
Totaal tests 4 Foute tests 3 Totale kosten $0.166 Responstijd (gem.) 15.0s
#201	Elephant Alpha medium	Openrouter	2	6.6	$0.000	2/4	1.19s
Totaal tests 4 Foute tests 2 Totale kosten $0.000 Responstijd (gem.) 1.19s
#207	Granite 4.1 8B none	IBM Granite	2	4.9	$0.007	1/4	844ms
Totaal tests 4 Foute tests 3 Totale kosten $0.007 Responstijd (gem.) 844ms

Modellen filteren

Topmodellen op Verkeerd antwoord-aantal

Verkeerd antwoord-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten

Anti-AI-trucs: Verkeerd antwoord

Modellen filteren

Topmodellen op Verkeerd antwoord-aantal

Verkeerd antwoord-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten