Ranglijst voor Anti-AI-trucs x Verkeerd antwoord

Zie welke AI-modellen op Anti-AI-trucs het meest kans hebben op Verkeerd antwoord, zodat je zwakke punten sneller ziet.

Getoonde modellen

Totaal fouten

306

Meest getroffen model

Seed-2.0-Lite 4

Foutredenen

Verkeerd antwoord306 Instructies niet gevolgd33 Extra opmaak20 API-fout15 Geen antwoord6 Time-out4

Categorieën

Domeinspecifiek433 Anti-AI-trucs306 Programmeren266 Puzzeloplossing214 Algemene kennis176 Gecombineerd71 Algemene intelligentie66 Instructies opvolgen65 Gegevensparsering en extractie41 Toolaanroepen4

144/144

Rang	Model	Bedrijf	Verkeerd antwoord-aantal	Categoriescore	Totale kosten	Correcte tests	Responstijd (gem.)
#181	Laguna S 2.1 low	Poolside	3	3.4	$0.091	0/4	80.7s
Totaal tests 4 Foute tests 4 Totale kosten $0.091 Responstijd (gem.) 80.7s
#183	GPT-4o-mini none	OpenAI	3	4.8	$0.010	1/4	1.34s
Totaal tests 4 Foute tests 3 Totale kosten $0.010 Responstijd (gem.) 1.34s
#185	GLM 4.7 Flash none	Z.ai	3	5.2	$0.016	1/4	5.51s
Totaal tests 4 Foute tests 3 Totale kosten $0.016 Responstijd (gem.) 5.51s
#186	Nemotron 3 Super none	NVIDIA	3	4.8	$0.008	1/4	4.46s
Totaal tests 4 Foute tests 3 Totale kosten $0.008 Responstijd (gem.) 4.46s
#191	KAT-Coder-Air V2.5 none	Kwaipilot	3	5.3	$0.067	1/4	2.68s
Totaal tests 4 Foute tests 3 Totale kosten $0.067 Responstijd (gem.) 2.68s
#196	Qwen3 Coder Next medium	Qwen	3	3.5	$0.032	0/4	8.64s
Totaal tests 4 Foute tests 4 Totale kosten $0.032 Responstijd (gem.) 8.64s
#202	Laguna M.1 none	Poolside	3	3.4	$0.009	0/4	705ms
Totaal tests 4 Foute tests 4 Totale kosten $0.009 Responstijd (gem.) 705ms
#207	Grok 4.20 none	X AI	3	4.8	$0.057	1/4	501ms
Totaal tests 4 Foute tests 3 Totale kosten $0.057 Responstijd (gem.) 501ms
#213	Grok 4.1 Fast none	X AI	3	3.2	$0.008	0/4	1.07s
Totaal tests 4 Foute tests 4 Totale kosten $0.008 Responstijd (gem.) 1.07s
#220	LFM2-24B-A2B none	Liquid	3	2.5	$0.001	0/3	471ms
Totaal tests 3 Foute tests 3 Totale kosten $0.001 Responstijd (gem.) 471ms
#27	Muse Spark 1.1 low	Meta	2	7.9	$0.647	2/4	4.36s
Totaal tests 4 Foute tests 2 Totale kosten $0.647 Responstijd (gem.) 4.36s
#50	DeepSeek V4 Pro high	DeepSeek	2	5.7	$0.200	1/4	25.7s
Totaal tests 4 Foute tests 3 Totale kosten $0.200 Responstijd (gem.) 25.7s
#51	MiniMax M3 medium	Minimax	2	5.5	$0.286	1/4	14.9s
Totaal tests 4 Foute tests 3 Totale kosten $0.286 Responstijd (gem.) 14.9s
#56	Kimi K2.7 Code medium	Moonshot AI	2	7.3	$0.740	2/4	11.6s
Totaal tests 4 Foute tests 2 Totale kosten $0.740 Responstijd (gem.) 11.6s
#63	Qwen3.7 Max none	Qwen	2	6.5	$0.197	2/4	1.08s
Totaal tests 4 Foute tests 2 Totale kosten $0.197 Responstijd (gem.) 1.08s

Modellen filteren

Topmodellen op Verkeerd antwoord-aantal

Verkeerd antwoord-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten

Anti-AI-trucs: Verkeerd antwoord

Modellen filteren

Topmodellen op Verkeerd antwoord-aantal

Verkeerd antwoord-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten