Modelranglijst voor Gecombineerd

Zie welke AI-modellen het best presteren op Gecombineerd, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Correcte tests ↓.

Getoonde modellen

Gemiddelde Gecombineerd-score

5.6

Beste model

Gemini 3.6 Flash 10.0

Foutredenen

Met foutreden Ongeldige toolaanroep91 Met foutreden Verkeerd antwoord69 Met foutreden Geen antwoord32 Met foutreden API-fout26 Met foutreden Time-out5 Met foutreden Extra opmaak1 Met foutreden Instructies niet gevolgd1

216/216

Rang	Model	Bedrijf	Gecombineerd-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#112	Gemini 3.1 Flash Lite Preview none	Google	3.0	6.4	$0.052	0/2	6.23s
Totaal tests 2 Foute tests 2 Totale kosten $0.052 Responstijd (gem.) 6.23s
#115	Mimo V2 PRO medium	Xiaomi	2.3	6.3	$0.333	0/1	64.7s
Totaal tests 1 Foute tests 1 Totale kosten $0.333 Responstijd (gem.) 64.7s
#116	Gemma 4 31B medium	Google	2.9	6.3	$0.107	0/2	433.1s
Totaal tests 2 Foute tests 2 Totale kosten $0.107 Responstijd (gem.) 433.1s
#121	Gemma 4 31B none	Google	3.8	6.2	$0.021	0/2	30.0s
Totaal tests 2 Foute tests 2 Totale kosten $0.021 Responstijd (gem.) 30.0s
#122	Seed-2.0-Lite none	Bytedance Seed	3.0	6.2	$0.066	0/2	25.6s
Totaal tests 2 Foute tests 2 Totale kosten $0.066 Responstijd (gem.) 25.6s
#123	GPT-5.6 Luna low	OpenAI	2.8	6.2	$0.249	0/2	13.7s
Totaal tests 2 Foute tests 2 Totale kosten $0.249 Responstijd (gem.) 13.7s
#124	Gemini 2.5 Flash none	Google	3.0	6.2	$0.017	0/2	61.2s
Totaal tests 2 Foute tests 2 Totale kosten $0.017 Responstijd (gem.) 61.2s
#125	Qwen3.5-35B-A3B medium	Qwen	3.8	6.2	$0.837	0/2	512.8s
Totaal tests 2 Foute tests 2 Totale kosten $0.837 Responstijd (gem.) 512.8s
#126	Gemini 3.1 Flash Lite minimal	Google	3.0	6.1	$0.047	0/2	7.75s
Totaal tests 2 Foute tests 2 Totale kosten $0.047 Responstijd (gem.) 7.75s
#128	Gemini 3.1 Flash Lite none	Google	3.0	6.1	$0.046	0/2	9.49s
Totaal tests 2 Foute tests 2 Totale kosten $0.046 Responstijd (gem.) 9.49s
#129	Inkling low	Thinkingmachines	2.9	6.1	$0.187	0/2	22.7s
Totaal tests 2 Foute tests 2 Totale kosten $0.187 Responstijd (gem.) 22.7s
#130	Qwen3.6 Flash none	Qwen	3.8	6.1	$0.062	0/2	26.5s
Totaal tests 2 Foute tests 2 Totale kosten $0.062 Responstijd (gem.) 26.5s
#131	Qwen3.5-Flash none	Qwen	2.9	6.1	$0.073	0/2	243.6s
Totaal tests 2 Foute tests 2 Totale kosten $0.073 Responstijd (gem.) 243.6s
#133	Qwen3.5-35B-A3B none	Qwen	3.8	6.1	$0.106	0/2	128.3s
Totaal tests 2 Foute tests 2 Totale kosten $0.106 Responstijd (gem.) 128.3s
#135	Nemotron 3 Ultra none	NVIDIA	3.0	6.1	$0.095	0/2	21.1s
Totaal tests 2 Foute tests 2 Totale kosten $0.095 Responstijd (gem.) 21.1s

←

1 9 10 11 15

→

Gecombineerd-ranglijst

Modellen filteren

Topmodellen op Gecombineerd-score

Gecombineerd-score vs totale kosten

Topmodellen op Responstijd (gem.)