Modelranglijst voor Puzzeloplossing

Zie welke AI-modellen het best presteren op Puzzeloplossing, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Correcte tests ↑.

Getoonde modellen

Gemiddelde Puzzeloplossing-score

6.7

Beste model

GPT-5.4 Nano 4.1

Foutredenen

Met foutreden Verkeerd antwoord201 Met foutreden Instructies niet gevolgd90 Met foutreden API-fout12 Met foutreden Extra opmaak8 Met foutreden Time-out5 Met foutreden Geen antwoord3

210/210

Rang	Model	Bedrijf	Puzzeloplossing-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#158	KAT-Coder-Air V2.5 low	Kwaipilot	3.1	5.4	$0.041	0/3	1.57s
Totaal tests 3 Foute tests 3 Totale kosten $0.041 Responstijd (gem.) 1.57s
#160	Laguna XS 2.1 none	Poolside	3.0	5.3	$0.008	0/3	1.01s
Totaal tests 3 Foute tests 3 Totale kosten $0.008 Responstijd (gem.) 1.01s
#161	Qwen3.6 35B A3B none	Qwen	3.2	5.3	$0.061	0/3	1.07s
Totaal tests 3 Foute tests 3 Totale kosten $0.061 Responstijd (gem.) 1.07s
#162	Ling-2.6-1T none	Inclusionai	3.1	5.3	$0.016	0/3	5.36s
Totaal tests 3 Foute tests 3 Totale kosten $0.016 Responstijd (gem.) 5.36s
#165	Mistral Small 4 none	Mistral	3.1	5.1	$0.022	0/3	399ms
Totaal tests 3 Foute tests 3 Totale kosten $0.022 Responstijd (gem.) 399ms
#166	Qwen3 Coder Next none	Qwen	3.0	5.1	$0.025	0/3	24.3s
Totaal tests 3 Foute tests 3 Totale kosten $0.025 Responstijd (gem.) 24.3s
#167	Mistral Small 4 medium	Mistral	3.4	5.1	$0.096	0/3	2.17s
Totaal tests 3 Foute tests 3 Totale kosten $0.096 Responstijd (gem.) 2.17s
#169	Qwen3.5-9B none	Qwen	3.2	5.1	$0.021	0/3	621ms
Totaal tests 3 Foute tests 3 Totale kosten $0.021 Responstijd (gem.) 621ms
#171	North Mini Code none	Cohere	3.5	5.1	$0.000	0/3	24.4s
Totaal tests 3 Foute tests 3 Totale kosten $0.000 Responstijd (gem.) 24.4s
#174	GPT-4o-mini none	OpenAI	3.5	5.0	$0.010	0/3	1.21s
Totaal tests 3 Foute tests 3 Totale kosten $0.010 Responstijd (gem.) 1.21s
#178	Ling-2.6-flash none	Inclusionai	2.9	4.9	$0.002	0/3	6.51s
Totaal tests 3 Foute tests 3 Totale kosten $0.002 Responstijd (gem.) 6.51s
#182	KAT-Coder-Air V2.5 none	Kwaipilot	2.9	4.8	$0.067	0/3	1.84s
Totaal tests 3 Foute tests 3 Totale kosten $0.067 Responstijd (gem.) 1.84s
#183	Trinity Large Preview none	Arcee AI	3.6	4.8	$0.008	0/3	1.97s
Totaal tests 3 Foute tests 3 Totale kosten $0.008 Responstijd (gem.) 1.97s
#187	Qwen3 Coder Next medium	Qwen	3.0	4.7	$0.032	0/3	1.25s
Totaal tests 3 Foute tests 3 Totale kosten $0.032 Responstijd (gem.) 1.25s
#188	Cobuddy medium	Baidu	3.6	4.7	$0.000	0/3	12.8s
Totaal tests 3 Foute tests 3 Totale kosten $0.000 Responstijd (gem.) 12.8s

Puzzeloplossing-ranglijst

Modellen filteren

Topmodellen op Puzzeloplossing-score

Puzzeloplossing-score vs totale kosten

Topmodellen op Responstijd (gem.)