Ranglijst voor Gegevensparsering en extractie x API-fout

Zie welke AI-modellen op Gegevensparsering en extractie het meest kans hebben op API-fout, zodat je zwakke punten sneller ziet. Sorteren op: Responstijd (gem.) ↓.

Getoonde modellen

Totaal fouten

Meest getroffen model

Qwen3.5-35B-A3B 1

Foutredenen

Verkeerd antwoord41 API-fout14 Geen antwoord8 Extra opmaak6 Time-out1

Categorieën

Programmeren45 Gecombineerd26 Toolaanroepen17 Anti-AI-trucs14 Gegevensparsering en extractie14 Algemene kennis13 Algemene intelligentie12 Puzzeloplossing12 Domeinspecifiek7 Instructies opvolgen1

14/14

Rang	Model	Bedrijf	API-fout-aantal	Categoriescore	Totale kosten	Correcte tests	Responstijd (gem.)
#119	Qwen3.5-35B-A3B medium	Qwen	1	7.3	$0.837	1/2	59.3s
Totaal tests 2 Foute tests 1 Totale kosten $0.837 Responstijd (gem.) 59.3s
#114	Qwen3.5-Flash medium	Qwen	1	7.3	$0.139	1/2	57.0s
Totaal tests 2 Foute tests 1 Totale kosten $0.139 Responstijd (gem.) 57.0s
#179	Ring-2.6-1T none	Inclusionai	1	3.0	$0.026	0/2	45.9s
Totaal tests 2 Foute tests 2 Totale kosten $0.026 Responstijd (gem.) 45.9s
#200	MiMo-V2-Flash none	Xiaomi	1	2.9	$0.025	0/2	19.7s
Totaal tests 2 Foute tests 2 Totale kosten $0.025 Responstijd (gem.) 19.7s
#135	Hy3 preview high	Tencent	1	6.5	$0.048	1/2	12.1s
Totaal tests 2 Foute tests 1 Totale kosten $0.048 Responstijd (gem.) 12.1s
#202	Grok Build 0.1 none	X AI	1	3.8	$0.547	0/2	9.33s
Totaal tests 2 Foute tests 2 Totale kosten $0.547 Responstijd (gem.) 9.33s
#79	Gemini 3.5 Flash none	Google	1	6.5	$1.079	1/2	8.10s
Totaal tests 2 Foute tests 1 Totale kosten $1.079 Responstijd (gem.) 8.10s
#206	gpt-oss-120b none	OpenAI	1	6.5	$0.010	1/2	7.12s
Totaal tests 2 Foute tests 1 Totale kosten $0.010 Responstijd (gem.) 7.12s
#153	Hy3 preview low	Tencent	1	6.5	$0.015	1/2	5.85s
Totaal tests 2 Foute tests 1 Totale kosten $0.015 Responstijd (gem.) 5.85s
#100	Hy3 preview medium	Tencent	1	6.5	$0.018	1/2	5.25s
Totaal tests 2 Foute tests 1 Totale kosten $0.018 Responstijd (gem.) 5.25s
#199	Hy3 preview none	Tencent	1	6.5	$0.003	1/2	2.85s
Totaal tests 2 Foute tests 1 Totale kosten $0.003 Responstijd (gem.) 2.85s
#167	Mistral Small 4 medium	Mistral	1	7.3	$0.096	1/2	1.23s
Totaal tests 2 Foute tests 1 Totale kosten $0.096 Responstijd (gem.) 1.23s
#113	MiMo-V2-Flash medium	Xiaomi	1	6.5	$0.043	1/2	0ms
Totaal tests 2 Foute tests 1 Totale kosten $0.043 Responstijd (gem.) 0ms
#209	Step 3.5 Flash none	Stepfun	1	1.5	$0.020	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.020 Responstijd (gem.) 0ms

Modellen filteren

Topmodellen op API-fout-aantal

API-fout-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten

Gegevensparsering en extractie: API-fout

Modellen filteren

Topmodellen op API-fout-aantal

API-fout-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten