Modelranglijst voor Puzzeloplossing

Zie welke AI-modellen het best presteren op Puzzeloplossing, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Correcte tests ↓.

Getoonde modellen

Gemiddelde Puzzeloplossing-score

6.7

Beste model

Gemini 3 Flash Preview 10.0

Foutredenen

Met foutreden Verkeerd antwoord201 Met foutreden Instructies niet gevolgd90 Met foutreden API-fout12 Met foutreden Extra opmaak8 Met foutreden Time-out5 Met foutreden Geen antwoord3

210/210

Rang	Model	Bedrijf	Puzzeloplossing-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#33	Kimi K3 max	Moonshot AI	10.0	8.0	$3.112	3/3	7.36s
Totaal tests 3 Foute tests 0 Totale kosten $3.112 Responstijd (gem.) 7.36s
#36	Qwen3.7 Plus medium	Qwen	10.0	7.9	$0.267	3/3	16.4s
Totaal tests 3 Foute tests 0 Totale kosten $0.267 Responstijd (gem.) 16.4s
#37	Qwen3.6 Plus medium	Qwen	10.0	7.8	$0.405	3/3	6.34s
Totaal tests 3 Foute tests 0 Totale kosten $0.405 Responstijd (gem.) 6.34s
#40	Claude Sonnet 4.6 medium	Anthropic	10.0	7.8	$2.057	3/3	5.31s
Totaal tests 3 Foute tests 0 Totale kosten $2.057 Responstijd (gem.) 5.31s
#41	Claude Opus 4.8 low	Anthropic	10.0	7.8	$2.077	3/3	3.01s
Totaal tests 3 Foute tests 0 Totale kosten $2.077 Responstijd (gem.) 3.01s
#42	GLM 5 medium	Z.ai	10.0	7.7	$0.307	3/3	11.3s
Totaal tests 3 Foute tests 0 Totale kosten $0.307 Responstijd (gem.) 11.3s
#54	GPT-5.3 Chat none	OpenAI	10.0	7.5	$0.571	3/3	2.99s
Totaal tests 3 Foute tests 0 Totale kosten $0.571 Responstijd (gem.) 2.99s
#55	GPT-5.6 Terra low	OpenAI	10.0	7.5	$0.519	3/3	4.46s
Totaal tests 3 Foute tests 0 Totale kosten $0.519 Responstijd (gem.) 4.46s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	10.0	7.5	$0.437	3/3	32.5s
Totaal tests 3 Foute tests 0 Totale kosten $0.437 Responstijd (gem.) 32.5s
#59	Qwen3.7 Max none	Qwen	10.0	7.4	$0.197	3/3	1.13s
Totaal tests 3 Foute tests 0 Totale kosten $0.197 Responstijd (gem.) 1.13s
#61	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.177	3/3	5.77s
Totaal tests 3 Foute tests 0 Totale kosten $0.177 Responstijd (gem.) 5.77s
#72	Qwen3.5-122B-A10B medium	Qwen	10.0	7.1	$1.046	3/3	17.9s
Totaal tests 3 Foute tests 0 Totale kosten $1.046 Responstijd (gem.) 17.9s
#79	Gemini 3.5 Flash none	Google	10.0	7.0	$1.079	3/3	3.13s
Totaal tests 3 Foute tests 0 Totale kosten $1.079 Responstijd (gem.) 3.13s
#82	DeepSeek V4 Pro none	DeepSeek	10.0	6.9	$0.096	3/3	3.61s
Totaal tests 3 Foute tests 0 Totale kosten $0.096 Responstijd (gem.) 3.61s
#88	Gemini 3.5 Flash minimal	Google	10.0	6.8	$0.300	3/3	1.45s
Totaal tests 3 Foute tests 0 Totale kosten $0.300 Responstijd (gem.) 1.45s

Puzzeloplossing-ranglijst

Modellen filteren

Topmodellen op Puzzeloplossing-score

Puzzeloplossing-score vs totale kosten

Topmodellen op Responstijd (gem.)