Modelranglijst voor Puzzeloplossing

Zie welke AI-modellen het best presteren op Puzzeloplossing, welke betrouwbaar blijven en waar de grootste verschillen zitten.

Getoonde modellen

Gemiddelde Puzzeloplossing-score

6.7

Beste model

Gemini 3.6 Flash 10.0

Foutredenen

Met foutreden Verkeerd antwoord204 Met foutreden Instructies niet gevolgd90 Met foutreden API-fout12 Met foutreden Extra opmaak8 Met foutreden Time-out5 Met foutreden Geen antwoord3

216/216

Rang	Model	Bedrijf	Puzzeloplossing-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#28	Gemini 2.5 Flash medium	Google	7.7	8.2	$0.643	2/3	3.18s
Totaal tests 3 Foute tests 1 Totale kosten $0.643 Responstijd (gem.) 3.18s
#34	GPT-5.2 Chat none	OpenAI	7.7	8.0	$0.604	2/3	4.10s
Totaal tests 3 Foute tests 1 Totale kosten $0.604 Responstijd (gem.) 4.10s
#38	GPT-5.6 Terra high	OpenAI	7.7	8.0	$1.055	2/3	5.45s
Totaal tests 3 Foute tests 1 Totale kosten $1.055 Responstijd (gem.) 5.45s
#47	Claude Opus 4.6 medium	Anthropic	7.7	7.7	$3.059	2/3	4.71s
Totaal tests 3 Foute tests 1 Totale kosten $3.059 Responstijd (gem.) 4.71s
#52	Grok Build 0.1 medium	X AI	7.7	7.6	$1.097	2/3	18.3s
Totaal tests 3 Foute tests 1 Totale kosten $1.097 Responstijd (gem.) 18.3s
#67	Claude Sonnet 4.6 none	Anthropic	7.7	7.3	$0.661	2/3	2.53s
Totaal tests 3 Foute tests 1 Totale kosten $0.661 Responstijd (gem.) 2.53s
#68	Gemini 3.1 Flash Lite Preview medium	Google	7.7	7.3	$0.115	2/3	5.30s
Totaal tests 3 Foute tests 1 Totale kosten $0.115 Responstijd (gem.) 5.30s
#70	Claude Opus 4.8 none	Anthropic	7.7	7.3	$1.166	2/3	2.74s
Totaal tests 3 Foute tests 1 Totale kosten $1.166 Responstijd (gem.) 2.74s
#75	Qwen3.7 Plus none	Qwen	7.7	7.2	$0.106	2/3	1.71s
Totaal tests 3 Foute tests 1 Totale kosten $0.106 Responstijd (gem.) 1.71s
#79	Grok 4.20 medium	X AI	7.7	7.1	$0.777	2/3	6.22s
Totaal tests 3 Foute tests 1 Totale kosten $0.777 Responstijd (gem.) 6.22s
#87	GPT-5.6 Sol none	OpenAI	7.7	6.9	$0.524	2/3	1.49s
Totaal tests 3 Foute tests 1 Totale kosten $0.524 Responstijd (gem.) 1.49s
#91	GPT-5.5 none	OpenAI	7.7	6.9	$0.544	2/3	1.29s
Totaal tests 3 Foute tests 1 Totale kosten $0.544 Responstijd (gem.) 1.29s
#93	Gemini 3 Flash Preview none	Google	7.7	6.8	$0.085	2/3	1.05s
Totaal tests 3 Foute tests 1 Totale kosten $0.085 Responstijd (gem.) 1.05s
#98	GLM 5V Turbo medium	Z.ai	7.7	6.7	$0.457	2/3	10.2s
Totaal tests 3 Foute tests 1 Totale kosten $0.457 Responstijd (gem.) 10.2s
#101	GLM 5.2 none	Z.ai	7.7	6.6	$0.128	2/3	3.31s
Totaal tests 3 Foute tests 1 Totale kosten $0.128 Responstijd (gem.) 3.31s

Puzzeloplossing-ranglijst

Modellen filteren

Topmodellen op Puzzeloplossing-score

Puzzeloplossing-score vs totale kosten

Topmodellen op Responstijd (gem.)