Modelranglijst voor Puzzeloplossing

Zie welke AI-modellen het best presteren op Puzzeloplossing, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Correcte tests ↑.

Getoonde modellen

Gemiddelde Puzzeloplossing-score

6.7

Beste model

GPT-5.4 Nano 4.1

Foutredenen

Met foutreden Verkeerd antwoord204 Met foutreden Instructies niet gevolgd90 Met foutreden API-fout12 Met foutreden Extra opmaak8 Met foutreden Time-out5 Met foutreden Geen antwoord3

216/216

Rang	Model	Bedrijf	Puzzeloplossing-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#174	MiMo-V2.5 none	Xiaomi	5.4	5.1	$0.025	1/3	2.13s
Totaal tests 3 Foute tests 2 Totale kosten $0.025 Responstijd (gem.) 2.13s
#176	GLM 5 Turbo none	Z.ai	5.5	5.1	$0.047	1/3	2.65s
Totaal tests 3 Foute tests 2 Totale kosten $0.047 Responstijd (gem.) 2.65s
#178	MiniMax M2.7 medium	Minimax	5.9	5.0	$0.163	1/3	24.9s
Totaal tests 3 Foute tests 2 Totale kosten $0.163 Responstijd (gem.) 24.9s
#181	Qwen3.6 Plus Preview medium	Qwen	5.3	4.9	$0.000	1/3	7.52s
Totaal tests 3 Foute tests 2 Totale kosten $0.000 Responstijd (gem.) 7.52s
#182	GLM 4.7 Flash none	Z.ai	6.4	4.9	$0.016	1/3	1.20s
Totaal tests 3 Foute tests 2 Totale kosten $0.016 Responstijd (gem.) 1.20s
#183	Nemotron 3 Super none	NVIDIA	5.5	4.9	$0.008	1/3	2.36s
Totaal tests 3 Foute tests 2 Totale kosten $0.008 Responstijd (gem.) 2.36s
#186	GPT-5.4 Nano none	OpenAI	5.4	4.8	$0.041	1/3	1.25s
Totaal tests 3 Foute tests 2 Totale kosten $0.041 Responstijd (gem.) 1.25s
#187	Grok 4.20 Multi Agent Beta medium	X AI	6.7	4.8	$5.599	1/3	5.19s
Totaal tests 3 Foute tests 2 Totale kosten $5.599 Responstijd (gem.) 5.19s
#190	Hunter Alpha medium	OpenRouter	6.1	4.7	$0.000	1/3	5.35s
Totaal tests 3 Foute tests 2 Totale kosten $0.000 Responstijd (gem.) 5.35s
#191	Grok 4.1 Fast medium	X AI	5.3	4.7	$0.069	1/3	7.40s
Totaal tests 3 Foute tests 2 Totale kosten $0.069 Responstijd (gem.) 7.40s
#192	Laguna M.1 medium	Poolside	5.3	4.7	$0.033	1/3	10.2s
Totaal tests 3 Foute tests 2 Totale kosten $0.033 Responstijd (gem.) 10.2s
#196	MiniMax M2.5 medium	Minimax	5.3	4.6	$0.340	1/3	11.2s
Totaal tests 3 Foute tests 2 Totale kosten $0.340 Responstijd (gem.) 11.2s
#201	Elephant Alpha medium	Openrouter	5.3	4.3	$0.000	1/3	868ms
Totaal tests 3 Foute tests 2 Totale kosten $0.000 Responstijd (gem.) 868ms
#202	Hunter Alpha none	OpenRouter	5.8	4.2	$0.000	1/3	3.71s
Totaal tests 3 Foute tests 2 Totale kosten $0.000 Responstijd (gem.) 3.71s
#203	Grok 4.20 none	X AI	5.3	4.1	$0.057	1/3	473ms
Totaal tests 3 Foute tests 2 Totale kosten $0.057 Responstijd (gem.) 473ms

Puzzeloplossing-ranglijst

Modellen filteren

Topmodellen op Puzzeloplossing-score

Puzzeloplossing-score vs totale kosten

Topmodellen op Responstijd (gem.)