Foutenranglijst voor Verkeerd antwoord

Zie welke AI-modellen het vaakst tegen Verkeerd antwoord aanlopen, zodat je betrouwbaarheidsrisico's ziet voordat je kiest.

Getoonde modellen

Totaal fouten

1558

Meest getroffen model

Mercury 2 17

Categorieën

In categorie Domeinspecifiek412 In categorie Anti-AI-trucs293 In categorie Programmeren252 In categorie Puzzeloplossing201 In categorie Algemene kennis168 In categorie Gecombineerd68 In categorie Instructies opvolgen61 In categorie Algemene intelligentie59 In categorie Gegevensparsering en extractie41 In categorie Toolaanroepen3

209/209

Rang	Model	Bedrijf	Verkeerd antwoord-aantal	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#145	GLM 5V Turbo none	Z.ai	11	5.6	$0.052	8/21	2.99s
Totaal tests 21 Foute tests 13 Totale kosten $0.052 Responstijd (gem.) 2.99s
#147	Mimo V2 PRO none	Xiaomi	11	5.6	$0.045	7/21	2.27s
Totaal tests 21 Foute tests 14 Totale kosten $0.045 Responstijd (gem.) 2.27s
#149	KAT-Coder-Air V2.5 medium	Kwaipilot	11	5.6	$0.048	8/22	8.42s
Totaal tests 22 Foute tests 14 Totale kosten $0.048 Responstijd (gem.) 8.42s
#152	Qwen3.6 27B none	Qwen	11	5.5	$0.087	7/22	10.7s
Totaal tests 22 Foute tests 15 Totale kosten $0.087 Responstijd (gem.) 10.7s
#154	MiMo-V2.5-Pro none	Xiaomi	11	5.5	$0.068	6/22	4.12s
Totaal tests 22 Foute tests 16 Totale kosten $0.068 Responstijd (gem.) 4.12s
#62	KAT-Coder-Pro V2.5 low	Kwaipilot	10	7.4	$0.387	11/22	19.5s
Totaal tests 22 Foute tests 11 Totale kosten $0.387 Responstijd (gem.) 19.5s
#69	KAT-Coder-Pro V2.5 high	Kwaipilot	10	7.2	$0.482	11/22	20.8s
Totaal tests 22 Foute tests 11 Totale kosten $0.482 Responstijd (gem.) 20.8s
#71	Qwen3.7 Plus none	Qwen	10	7.2	$0.106	11/22	12.1s
Totaal tests 22 Foute tests 11 Totale kosten $0.106 Responstijd (gem.) 12.1s
#83	GPT-5.6 Sol none	OpenAI	10	6.9	$0.524	11/22	2.16s
Totaal tests 22 Foute tests 11 Totale kosten $0.524 Responstijd (gem.) 2.16s
#92	KAT-Coder-Pro V2.5 none	Kwaipilot	10	6.7	$0.476	11/22	25.6s
Totaal tests 22 Foute tests 11 Totale kosten $0.476 Responstijd (gem.) 25.6s
#98	Qwen3.6 Max Preview none	Qwen	10	6.6	$0.231	12/22	7.82s
Totaal tests 22 Foute tests 10 Totale kosten $0.231 Responstijd (gem.) 7.82s
#117	GPT-5.6 Luna low	OpenAI	10	6.2	$0.249	10/22	5.04s
Totaal tests 22 Foute tests 12 Totale kosten $0.249 Responstijd (gem.) 5.04s
#146	Owl Alpha medium	Openrouter	10	5.6	$0.000	8/21	11.9s
Totaal tests 21 Foute tests 13 Totale kosten $0.000 Responstijd (gem.) 11.9s
#148	Owl Alpha none	Openrouter	10	5.6	$0.000	7/21	9.88s
Totaal tests 21 Foute tests 14 Totale kosten $0.000 Responstijd (gem.) 9.88s
#156	Gemma 4 26B A4B none	Google	10	5.5	$0.015	8/22	7.64s
Totaal tests 22 Foute tests 14 Totale kosten $0.015 Responstijd (gem.) 7.64s

Verkeerd antwoord-fouten

Modellen filteren

Topmodellen op Verkeerd antwoord-aantal

Verkeerd antwoord-aantal vs Score

Topmodellen op Responstijd (gem.)