Modelranglijst voor Puzzeloplossing

Zie welke AI-modellen het best presteren op Puzzeloplossing, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Correcte tests ↓.

Getoonde modellen

Gemiddelde Puzzeloplossing-score

6.7

Beste model

Gemini 3.6 Flash 10.0

Foutredenen

Met foutreden Verkeerd antwoord204 Met foutreden Instructies niet gevolgd90 Met foutreden API-fout12 Met foutreden Extra opmaak8 Met foutreden Time-out5 Met foutreden Geen antwoord3

216/216

Rang	Model	Bedrijf	Puzzeloplossing-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#74	Qwen3.5 Plus 2026-04-20 medium	Qwen	8.2	7.2	$0.317	2/3	17.7s
Totaal tests 3 Foute tests 1 Totale kosten $0.317 Responstijd (gem.) 17.7s
#75	Qwen3.7 Plus none	Qwen	7.7	7.2	$0.106	2/3	1.71s
Totaal tests 3 Foute tests 1 Totale kosten $0.106 Responstijd (gem.) 1.71s
#78	GLM 5.1 medium	Z.ai	8.2	7.1	$0.535	2/3	31.6s
Totaal tests 3 Foute tests 1 Totale kosten $0.535 Responstijd (gem.) 31.6s
#79	Grok 4.20 medium	X AI	7.7	7.1	$0.777	2/3	6.22s
Totaal tests 3 Foute tests 1 Totale kosten $0.777 Responstijd (gem.) 6.22s
#84	Seed-2.0-Mini medium	Bytedance Seed	8.2	7.0	$0.101	2/3	31.8s
Totaal tests 3 Foute tests 1 Totale kosten $0.101 Responstijd (gem.) 31.8s
#87	GPT-5.6 Sol none	OpenAI	7.7	6.9	$0.524	2/3	1.49s
Totaal tests 3 Foute tests 1 Totale kosten $0.524 Responstijd (gem.) 1.49s
#89	Qwen3.6 Flash medium	Qwen	8.2	6.9	$0.738	2/3	6.29s
Totaal tests 3 Foute tests 1 Totale kosten $0.738 Responstijd (gem.) 6.29s
#91	GPT-5.5 none	OpenAI	7.7	6.9	$0.544	2/3	1.29s
Totaal tests 3 Foute tests 1 Totale kosten $0.544 Responstijd (gem.) 1.29s
#93	Gemini 3 Flash Preview none	Google	7.7	6.8	$0.085	2/3	1.05s
Totaal tests 3 Foute tests 1 Totale kosten $0.085 Responstijd (gem.) 1.05s
#94	Qwen3.6 35B A3B medium	Qwen	8.0	6.7	$0.746	2/3	5.95s
Totaal tests 3 Foute tests 1 Totale kosten $0.746 Responstijd (gem.) 5.95s
#95	Gemini 3.5 Flash-Lite low	Google	7.8	6.7	$0.145	2/3	1.22s
Totaal tests 3 Foute tests 1 Totale kosten $0.145 Responstijd (gem.) 1.22s
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	8.2	6.7	$0.476	2/3	3.03s
Totaal tests 3 Foute tests 1 Totale kosten $0.476 Responstijd (gem.) 3.03s
#98	GLM 5V Turbo medium	Z.ai	7.7	6.7	$0.457	2/3	10.2s
Totaal tests 3 Foute tests 1 Totale kosten $0.457 Responstijd (gem.) 10.2s
#101	GLM 5.2 none	Z.ai	7.7	6.6	$0.128	2/3	3.31s
Totaal tests 3 Foute tests 1 Totale kosten $0.128 Responstijd (gem.) 3.31s
#104	Gemini 3.5 Flash-Lite medium	Google	8.4	6.5	$0.369	2/3	1.70s
Totaal tests 3 Foute tests 1 Totale kosten $0.369 Responstijd (gem.) 1.70s

Puzzeloplossing-ranglijst

Modellen filteren

Topmodellen op Puzzeloplossing-score

Puzzeloplossing-score vs totale kosten

Topmodellen op Responstijd (gem.)