Modelranglijst voor Gecombineerd

Zie welke AI-modellen het best presteren op Gecombineerd, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Responstijd (gem.) ↓.

Getoonde modellen

Gemiddelde Gecombineerd-score

5.6

Beste model

Qwen3.6 35B A3B 3.0

Foutredenen

Met foutreden Ongeldige toolaanroep91 Met foutreden Verkeerd antwoord69 Met foutreden Geen antwoord32 Met foutreden API-fout26 Met foutreden Time-out5 Met foutreden Extra opmaak1 Met foutreden Instructies niet gevolgd1

216/216

Rang	Model	Bedrijf	Gecombineerd-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#26	Claude Sonnet 5 medium	Anthropic	7.3	8.3	$0.922	1/2	51.9s
Totaal tests 2 Foute tests 1 Totale kosten $0.922 Responstijd (gem.) 51.9s
#182	GLM 4.7 Flash none	Z.ai	3.0	4.9	$0.016	0/2	50.2s
Totaal tests 2 Foute tests 2 Totale kosten $0.016 Responstijd (gem.) 50.2s
#101	GLM 5.2 none	Z.ai	6.9	6.6	$0.128	1/2	50.2s
Totaal tests 2 Foute tests 1 Totale kosten $0.128 Responstijd (gem.) 50.2s
#194	Cobuddy medium	Baidu	1.5	4.7	$0.000	0/1	47.4s
Totaal tests 1 Foute tests 1 Totale kosten $0.000 Responstijd (gem.) 47.4s
#157	GLM 5.1 none	Z.ai	2.8	5.5	$0.164	0/2	46.9s
Totaal tests 2 Foute tests 2 Totale kosten $0.164 Responstijd (gem.) 46.9s
#106	Hy3 preview medium	Tencent	5.0	6.5	$0.018	1/1	46.0s
Totaal tests 1 Foute tests 0 Totale kosten $0.018 Responstijd (gem.) 46.0s
#12	Gemini 3.5 Flash medium	Google	10.0	9.1	$0.642	2/2	44.4s
Totaal tests 2 Foute tests 0 Totale kosten $0.642 Responstijd (gem.) 44.4s
#18	Claude Opus 4.7 medium	Anthropic	10.0	8.7	$1.477	2/2	43.4s
Totaal tests 2 Foute tests 0 Totale kosten $1.477 Responstijd (gem.) 43.4s
#19	Muse Spark 1.1 medium	Meta	8.3	8.6	$1.357	1/2	42.6s
Totaal tests 2 Foute tests 1 Totale kosten $1.357 Responstijd (gem.) 42.6s
#79	Grok 4.20 medium	X AI	8.7	7.1	$0.777	1/2	42.2s
Totaal tests 2 Foute tests 1 Totale kosten $0.777 Responstijd (gem.) 42.2s
#1	Gemini 3.6 Flash medium	Google	10.0	9.9	$0.831	2/2	42.1s
Totaal tests 2 Foute tests 0 Totale kosten $0.831 Responstijd (gem.) 42.1s
#90	Step 3.7 Flash high	Stepfun	8.7	6.9	$1.207	1/2	41.2s
Totaal tests 2 Foute tests 1 Totale kosten $1.207 Responstijd (gem.) 41.2s
#36	Inkling medium	Thinkingmachines	7.3	8.0	$0.391	1/2	41.2s
Totaal tests 2 Foute tests 1 Totale kosten $0.391 Responstijd (gem.) 41.2s
#10	Gemini 3.1 Pro Preview medium	Google	9.8	9.2	$1.361	2/2	40.4s
Totaal tests 2 Foute tests 0 Totale kosten $1.361 Responstijd (gem.) 40.4s
#167	Qwen3.6 35B A3B none	Qwen	3.8	5.3	$0.061	0/2	39.5s
Totaal tests 2 Foute tests 2 Totale kosten $0.061 Responstijd (gem.) 39.5s

Gecombineerd-ranglijst

Modellen filteren

Topmodellen op Gecombineerd-score

Gecombineerd-score vs totale kosten

Topmodellen op Responstijd (gem.)