Foutenranglijst voor Geen antwoord

Zie welke AI-modellen het vaakst tegen Geen antwoord aanlopen, zodat je betrouwbaarheidsrisico's ziet voordat je kiest.

Getoonde modellen

Totaal fouten

Meest getroffen model

Categorieën

In categorie Gecombineerd29 In categorie Programmeren18 In categorie Algemene kennis12 In categorie Domeinspecifiek8 In categorie Gegevensparsering en extractie5 In categorie Anti-AI-trucs4 In categorie Puzzeloplossing3 In categorie Instructies opvolgen2 In categorie Toolaanroepen2

64/64

Rang	Model	Bedrijf	Geen antwoord-aantal	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#85	Step 3.7 Flash high	Stepfun	4	6.9	$1.207	11/22	64.7s
Totaal tests 22 Foute tests 11 Totale kosten $1.207 Responstijd (gem.) 64.7s
#96	Qwen3.6 27B medium	Qwen	3	6.5	$0.779	10/22	106.3s
Totaal tests 22 Foute tests 12 Totale kosten $0.779 Responstijd (gem.) 106.3s
#190	GLM 4.7 Flash medium	Z.ai	3	4.3	$0.166	4/22	142.6s
Totaal tests 22 Foute tests 18 Totale kosten $0.166 Responstijd (gem.) 142.6s
#12	Grok 4.5 high	X AI	2	8.9	$1.707	17/22	76.5s
Totaal tests 22 Foute tests 5 Totale kosten $1.707 Responstijd (gem.) 76.5s
#17	Claude Fable 5 medium	Anthropic	2	8.6	$3.478	17/22	17.2s
Totaal tests 22 Foute tests 5 Totale kosten $3.478 Responstijd (gem.) 17.2s
#38	GLM 5.2 medium	Z.ai	2	7.8	$0.068	15/21	23.3s
Totaal tests 21 Foute tests 6 Totale kosten $0.068 Responstijd (gem.) 23.3s
#76	Kimi K2.5 medium	Moonshot AI	2	7.0	$0.600	10/22	99.0s
Totaal tests 22 Foute tests 12 Totale kosten $0.600 Responstijd (gem.) 99.0s
#93	Gemma 4 26B A4B medium	Google	2	6.6	$0.082	14/22	103.8s
Totaal tests 22 Foute tests 8 Totale kosten $0.082 Responstijd (gem.) 103.8s
#108	Claude Sonnet 5 none	Anthropic	2	6.3	$0.548	8/22	6.04s
Totaal tests 22 Foute tests 14 Totale kosten $0.548 Responstijd (gem.) 6.04s
#115	Qwen3.5-35B-A3B medium	Qwen	2	6.2	$0.837	11/22	112.5s
Totaal tests 22 Foute tests 11 Totale kosten $0.837 Responstijd (gem.) 112.5s
#130	Mimo V2 Omni medium	Xiaomi	2	5.9	$0.683	10/21	41.2s
Totaal tests 21 Foute tests 11 Totale kosten $0.683 Responstijd (gem.) 41.2s
#168	MiniMax M2.7 medium	Minimax	2	5.0	$0.163	5/22	41.3s
Totaal tests 22 Foute tests 17 Totale kosten $0.163 Responstijd (gem.) 41.3s
#186	MiniMax M2.5 medium	Minimax	2	4.6	$0.340	5/22	68.3s
Totaal tests 22 Foute tests 17 Totale kosten $0.340 Responstijd (gem.) 68.3s
#194	Laguna Xs.2 medium	Poolside	2	4.1	$0.015	6/19	6.73s
Totaal tests 19 Foute tests 13 Totale kosten $0.015 Responstijd (gem.) 6.73s
#200	Qwen3.5-9B medium	Qwen	2	3.8	$0.036	3/22	82.2s
Totaal tests 22 Foute tests 19 Totale kosten $0.036 Responstijd (gem.) 82.2s

1 2 3 4 5

→

Geen antwoord-fouten

Modellen filteren

Topmodellen op Geen antwoord-aantal

Geen antwoord-aantal vs Score

Topmodellen op Responstijd (gem.)