Modelranglijst voor Puzzeloplossing

Zie welke AI-modellen het best presteren op Puzzeloplossing, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Correcte tests ↓.

Getoonde modellen

Gemiddelde Puzzeloplossing-score

6.7

Beste model

Gemini 3.6 Flash 10.0

Foutredenen

Met foutreden Verkeerd antwoord204 Met foutreden Instructies niet gevolgd90 Met foutreden API-fout12 Met foutreden Extra opmaak8 Met foutreden Time-out5 Met foutreden Geen antwoord3

216/216

Rang	Model	Bedrijf	Puzzeloplossing-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#105	Qwen3.6 27B medium	Qwen	7.7	6.5	$0.779	2/3	61.1s
Totaal tests 3 Foute tests 1 Totale kosten $0.779 Responstijd (gem.) 61.1s
#106	Hy3 preview medium	Tencent	7.7	6.5	$0.018	2/3	11.1s
Totaal tests 3 Foute tests 1 Totale kosten $0.018 Responstijd (gem.) 11.1s
#107	MiMo-V2.5 medium	Xiaomi	8.2	6.5	$0.082	2/3	20.3s
Totaal tests 3 Foute tests 1 Totale kosten $0.082 Responstijd (gem.) 20.3s
#113	Qwen3.5 Plus 2026-02-15 none	Qwen	7.7	6.4	$0.073	2/3	2.71s
Totaal tests 3 Foute tests 1 Totale kosten $0.073 Responstijd (gem.) 2.71s
#119	MiMo-V2-Flash medium	Xiaomi	7.7	6.3	$0.043	2/3	3.87s
Totaal tests 3 Foute tests 1 Totale kosten $0.043 Responstijd (gem.) 3.87s
#120	Qwen3.5-Flash medium	Qwen	8.2	6.2	$0.139	2/3	27.6s
Totaal tests 3 Foute tests 1 Totale kosten $0.139 Responstijd (gem.) 27.6s
#123	GPT-5.6 Luna low	OpenAI	7.6	6.2	$0.249	2/3	3.59s
Totaal tests 3 Foute tests 1 Totale kosten $0.249 Responstijd (gem.) 3.59s
#124	Gemini 2.5 Flash none	Google	7.7	6.2	$0.017	2/3	604ms
Totaal tests 3 Foute tests 1 Totale kosten $0.017 Responstijd (gem.) 604ms
#125	Qwen3.5-35B-A3B medium	Qwen	8.2	6.2	$0.837	2/3	33.1s
Totaal tests 3 Foute tests 1 Totale kosten $0.837 Responstijd (gem.) 33.1s
#141	Hy3 preview high	Tencent	7.7	5.9	$0.048	2/3	27.9s
Totaal tests 3 Foute tests 1 Totale kosten $0.048 Responstijd (gem.) 27.9s
#147	GLM 5 none	Z.ai	7.7	5.7	$0.041	2/3	1.91s
Totaal tests 3 Foute tests 1 Totale kosten $0.041 Responstijd (gem.) 1.91s
#157	GLM 5.1 none	Z.ai	7.7	5.5	$0.164	2/3	1.45s
Totaal tests 3 Foute tests 1 Totale kosten $0.164 Responstijd (gem.) 1.45s
#169	Gemini 3.1 Flash Lite Preview high	Google	7.7	5.3	$2.310	2/3	46.7s
Totaal tests 3 Foute tests 1 Totale kosten $2.310 Responstijd (gem.) 46.7s
#179	DeepSeek V3.2 none	DeepSeek	7.6	5.0	$0.054	2/3	6.91s
Totaal tests 3 Foute tests 1 Totale kosten $0.054 Responstijd (gem.) 6.91s
#185	Ring-2.6-1T none	Inclusionai	7.7	4.8	$0.026	2/3	31.5s
Totaal tests 3 Foute tests 1 Totale kosten $0.026 Responstijd (gem.) 31.5s

Puzzeloplossing-ranglijst

Modellen filteren

Topmodellen op Puzzeloplossing-score

Puzzeloplossing-score vs totale kosten

Topmodellen op Responstijd (gem.)