Foutenranglijst voor API-fout

Zie welke AI-modellen het vaakst tegen API-fout aanlopen, zodat je betrouwbaarheidsrisico's ziet voordat je kiest.

Getoonde modellen

Totaal fouten

159

Meest getroffen model

Categorieën

In categorie Programmeren44 In categorie Gecombineerd25 In categorie Toolaanroepen17 In categorie Anti-AI-trucs14 In categorie Gegevensparsering en extractie14 In categorie Algemene kennis13 In categorie Algemene intelligentie12 In categorie Puzzeloplossing12 In categorie Domeinspecifiek7 In categorie Instructies opvolgen1

66/66

Rang	Model	Bedrijf	API-fout-aantal	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#171	Qwen3.6 Plus Preview medium	Qwen	8	4.9	$0.000	9/19	15.2s
Totaal tests 19 Foute tests 10 Totale kosten $0.000 Responstijd (gem.) 15.2s
#131	Hy3 preview high	Tencent	7	5.9	$0.048	11/21	56.6s
Totaal tests 21 Foute tests 10 Totale kosten $0.048 Responstijd (gem.) 56.6s
#149	Hy3 preview low	Tencent	7	5.5	$0.015	10/21	24.6s
Totaal tests 21 Foute tests 11 Totale kosten $0.015 Responstijd (gem.) 24.6s
#175	Ring-2.6-1T none	Inclusionai	6	4.8	$0.026	9/22	55.1s
Totaal tests 22 Foute tests 13 Totale kosten $0.026 Responstijd (gem.) 55.1s
#203	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	6	3.4	$0.000	4/19	17.1s
Totaal tests 19 Foute tests 15 Totale kosten $0.000 Responstijd (gem.) 17.1s
#204	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	6	3.2	$0.000	2/19	728ms
Totaal tests 19 Foute tests 17 Totale kosten $0.000 Responstijd (gem.) 728ms
#78	Gemini 3.5 Flash none	Google	4	7.0	$1.079	15/22	9.93s
Totaal tests 22 Foute tests 7 Totale kosten $1.079 Responstijd (gem.) 9.93s
#129	Gemini 3 PRO Preview medium	Google	4	6.0	$0.385	14/21	9.05s
Totaal tests 21 Foute tests 7 Totale kosten $0.385 Responstijd (gem.) 9.05s
#136	Nemotron 3 Super medium	NVIDIA	4	5.7	$0.066	8/22	52.0s
Totaal tests 22 Foute tests 14 Totale kosten $0.066 Responstijd (gem.) 52.0s
#169	DeepSeek V3.2 none	DeepSeek	4	5.0	$0.054	6/22	18.3s
Totaal tests 22 Foute tests 16 Totale kosten $0.054 Responstijd (gem.) 18.3s
#182	Laguna M.1 medium	Poolside	4	4.7	$0.033	9/19	14.7s
Totaal tests 19 Foute tests 10 Totale kosten $0.033 Responstijd (gem.) 14.7s
#188	Laguna M.1 none	Poolside	4	4.4	$0.009	4/19	2.89s
Totaal tests 19 Foute tests 15 Totale kosten $0.009 Responstijd (gem.) 2.89s
#194	Laguna Xs.2 medium	Poolside	4	4.1	$0.015	6/19	6.73s
Totaal tests 19 Foute tests 13 Totale kosten $0.015 Responstijd (gem.) 6.73s
#195	Hy3 preview none	Tencent	4	4.0	$0.003	4/21	12.9s
Totaal tests 21 Foute tests 17 Totale kosten $0.003 Responstijd (gem.) 12.9s
#201	Laguna Xs.2 none	Poolside	4	3.8	$0.004	5/19	806ms
Totaal tests 19 Foute tests 14 Totale kosten $0.004 Responstijd (gem.) 806ms

1 2 3 4 5

→

API-fout-fouten

Modellen filteren

Topmodellen op API-fout-aantal

API-fout-aantal vs Score

Topmodellen op Responstijd (gem.)