Ranglijst voor Algemene intelligentie x Verkeerd antwoord

Zie welke AI-modellen op Algemene intelligentie het meest kans hebben op Verkeerd antwoord, zodat je zwakke punten sneller ziet. Sorteren op: Responstijd (gem.) ↑.

Getoonde modellen

Totaal fouten

Meest getroffen model

Granite 4.1 8B 1

Foutredenen

Instructies niet gevolgd78 Verkeerd antwoord59 API-fout12 Time-out4

Categorieën

Domeinspecifiek412 Anti-AI-trucs293 Programmeren252 Puzzeloplossing201 Algemene kennis168 Gecombineerd68 Instructies opvolgen61 Algemene intelligentie59 Gegevensparsering en extractie41 Toolaanroepen3

59/59

Rang	Model	Bedrijf	Verkeerd antwoord-aantal	Categoriescore	Totale kosten	Correcte tests	Responstijd (gem.)
#201	Granite 4.1 8B none	IBM Granite	1	4.0	$0.007	0/1	499ms
Totaal tests 1 Foute tests 1 Totale kosten $0.007 Responstijd (gem.) 499ms
#160	Laguna XS 2.1 none	Poolside	1	5.0	$0.008	0/1	529ms
Totaal tests 1 Foute tests 1 Totale kosten $0.008 Responstijd (gem.) 529ms
#118	Gemini 2.5 Flash none	Google	1	5.0	$0.017	0/1	615ms
Totaal tests 1 Foute tests 1 Totale kosten $0.017 Responstijd (gem.) 615ms
#197	Grok 4.20 none	X AI	1	4.8	$0.057	0/1	659ms
Totaal tests 1 Foute tests 1 Totale kosten $0.057 Responstijd (gem.) 659ms
#165	Mistral Small 4 none	Mistral	1	4.0	$0.022	0/1	729ms
Totaal tests 1 Foute tests 1 Totale kosten $0.022 Responstijd (gem.) 729ms
#151	GLM 5.1 none	Z.ai	1	5.0	$0.164	0/1	790ms
Totaal tests 1 Foute tests 1 Totale kosten $0.164 Responstijd (gem.) 790ms
#164	Inkling none	Thinkingmachines	1	5.0	$0.147	0/1	859ms
Totaal tests 1 Foute tests 1 Totale kosten $0.147 Responstijd (gem.) 859ms
#174	GPT-4o-mini none	OpenAI	1	4.0	$0.010	0/1	909ms
Totaal tests 1 Foute tests 1 Totale kosten $0.010 Responstijd (gem.) 909ms
#177	Nemotron 3 Super none	NVIDIA	1	4.6	$0.008	0/1	950ms
Totaal tests 1 Foute tests 1 Totale kosten $0.008 Responstijd (gem.) 950ms
#122	Gemini 3.1 Flash Lite none	Google	1	4.0	$0.046	0/1	992ms
Totaal tests 1 Foute tests 1 Totale kosten $0.046 Responstijd (gem.) 992ms
#159	GPT-5.6 Luna none	OpenAI	1	5.0	$0.142	0/1	1.00s
Totaal tests 1 Foute tests 1 Totale kosten $0.142 Responstijd (gem.) 1.00s
#132	GPT-5.6 Terra none	OpenAI	1	5.0	$0.349	0/1	1.03s
Totaal tests 1 Foute tests 1 Totale kosten $0.349 Responstijd (gem.) 1.03s
#105	Gemini 3.1 Flash Lite low	Google	1	4.0	$0.621	0/1	1.37s
Totaal tests 1 Foute tests 1 Totale kosten $0.621 Responstijd (gem.) 1.37s
#178	Ling-2.6-flash none	Inclusionai	1	4.0	$0.002	0/1	1.45s
Totaal tests 1 Foute tests 1 Totale kosten $0.002 Responstijd (gem.) 1.45s
#83	GPT-5.6 Sol none	OpenAI	1	6.5	$0.524	0/1	1.52s
Totaal tests 1 Foute tests 1 Totale kosten $0.524 Responstijd (gem.) 1.52s

Modellen filteren

Topmodellen op Verkeerd antwoord-aantal

Verkeerd antwoord-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten

Algemene intelligentie: Verkeerd antwoord

Modellen filteren

Topmodellen op Verkeerd antwoord-aantal

Verkeerd antwoord-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten