Ranglijst voor Algemene kennis x API-fout

Zie welke AI-modellen op Algemene kennis het meest kans hebben op API-fout, zodat je zwakke punten sneller ziet. Sorteren op: Responstijd (gem.) ↓.

Getoonde modellen

Totaal fouten

Meest getroffen model

North Mini Code 1

Foutredenen

Verkeerd antwoord168 API-fout13 Geen antwoord13

Categorieën

Programmeren45 Gecombineerd26 Toolaanroepen17 Anti-AI-trucs14 Gegevensparsering en extractie14 Algemene kennis13 Algemene intelligentie12 Puzzeloplossing12 Domeinspecifiek7 Instructies opvolgen1

13/13

Rang	Model	Bedrijf	API-fout-aantal	Categoriescore	Totale kosten	Correcte tests	Responstijd (gem.)
#137	North Mini Code medium	Cohere	1	3.0	$0.000	0/1	305.0s
Totaal tests 1 Foute tests 1 Totale kosten $0.000 Responstijd (gem.) 305.0s
#204	Qwen3.5-9B medium	Qwen	1	3.0	$0.036	0/1	177.0s
Totaal tests 1 Foute tests 1 Totale kosten $0.036 Responstijd (gem.) 177.0s
#133	Gemini 3 PRO Preview medium	Google	1	3.0	$0.385	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.385 Responstijd (gem.) 0ms
#162	Ling-2.6-1T none	Inclusionai	1	3.0	$0.016	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.016 Responstijd (gem.) 0ms
#175	Qwen3.6 Plus Preview medium	Qwen	1	3.0	$0.000	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.000 Responstijd (gem.) 0ms
#186	Laguna M.1 medium	Poolside	1	3.0	$0.033	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.033 Responstijd (gem.) 0ms
#192	Laguna M.1 none	Poolside	1	3.0	$0.009	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.009 Responstijd (gem.) 0ms
#193	Elephant Alpha none	Openrouter	1	3.0	$0.000	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.000 Responstijd (gem.) 0ms
#195	Elephant Alpha medium	Openrouter	1	3.0	$0.000	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.000 Responstijd (gem.) 0ms
#198	Laguna Xs.2 medium	Poolside	1	3.0	$0.015	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.015 Responstijd (gem.) 0ms
#205	Laguna Xs.2 none	Poolside	1	3.0	$0.004	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.004 Responstijd (gem.) 0ms
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	3.0	$0.000	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.000 Responstijd (gem.) 0ms
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	1	3.0	$0.000	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.000 Responstijd (gem.) 0ms

Modellen filteren

Topmodellen op API-fout-aantal

API-fout-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten

Algemene kennis: API-fout

Modellen filteren

Topmodellen op API-fout-aantal

API-fout-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten