Ranglijst voor Algemene intelligentie x API-fout

Zie welke AI-modellen op Algemene intelligentie het meest kans hebben op API-fout, zodat je zwakke punten sneller ziet. Sorteren op: Responstijd (gem.) ↓.

Getoonde modellen

Totaal fouten

Meest getroffen model

DeepSeek V3.2 1

Foutredenen

Instructies niet gevolgd78 Verkeerd antwoord59 API-fout12 Time-out4

Categorieën

Programmeren45 Gecombineerd26 Toolaanroepen17 Anti-AI-trucs14 Gegevensparsering en extractie14 Algemene kennis13 Algemene intelligentie12 Puzzeloplossing12 Domeinspecifiek7 Instructies opvolgen1

12/12

Rang	Model	Bedrijf	API-fout-aantal	Categoriescore	Totale kosten	Correcte tests	Responstijd (gem.)
#76	DeepSeek V3.2 medium	DeepSeek	1	3.4	$0.078	0/1	58.3s
Totaal tests 1 Foute tests 1 Totale kosten $0.078 Responstijd (gem.) 58.3s
#173	DeepSeek V3.2 none	DeepSeek	1	4.7	$0.054	0/1	9.32s
Totaal tests 1 Foute tests 1 Totale kosten $0.054 Responstijd (gem.) 9.32s
#51	Nemotron 3 Ultra medium	NVIDIA	1	3.7	$0.774	0/1	2.52s
Totaal tests 1 Foute tests 1 Totale kosten $0.774 Responstijd (gem.) 2.52s
#135	Hy3 preview high	Tencent	1	3.0	$0.048	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.048 Responstijd (gem.) 0ms
#153	Hy3 preview low	Tencent	1	3.0	$0.015	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.015 Responstijd (gem.) 0ms
#175	Qwen3.6 Plus Preview medium	Qwen	1	3.0	$0.000	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.000 Responstijd (gem.) 0ms
#186	Laguna M.1 medium	Poolside	1	3.0	$0.033	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.033 Responstijd (gem.) 0ms
#192	Laguna M.1 none	Poolside	1	3.0	$0.009	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.009 Responstijd (gem.) 0ms
#198	Laguna Xs.2 medium	Poolside	1	3.0	$0.015	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.015 Responstijd (gem.) 0ms
#205	Laguna Xs.2 none	Poolside	1	3.0	$0.004	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.004 Responstijd (gem.) 0ms
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	3.0	$0.000	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.000 Responstijd (gem.) 0ms
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	1	3.0	$0.000	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.000 Responstijd (gem.) 0ms

Modellen filteren

Topmodellen op API-fout-aantal

API-fout-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten

Algemene intelligentie: API-fout

Modellen filteren

Topmodellen op API-fout-aantal

API-fout-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten