AI BENCHY
Advertise here

AI BENCHY Categorie

Puzzeloplossing-ranglijst

Zie welke AI-modellen het best presteren op Puzzeloplossing, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Metriek โ†‘.

Getoonde modellen

15

Gemiddelde Puzzeloplossing-score

6.7

Rang Model Bedrijf Puzzeloplossing-score Score Correcte tests Responstijd (gem.)
#78 Qwen3.6 27B medium Qwen 7.7 6.8 2/3 61.1s
#82 Hy3 preview high Tencent 7.7 6.6 2/3 27.9s
#88 Qwen3.7 Plus none Qwen 7.7 6.4 2/3 1.71s
#91 GPT-5.5 none OpenAI 7.7 6.4 2/3 1.29s
#95 Qwen3.5 Plus 2026-02-15 none Qwen 7.7 6.3 2/3 2.71s
#96 Ring-2.6-1T none Inclusionai 7.7 6.2 2/3 31.5s
#97 Gemini 2.5 Flash none Google 7.7 6.2 2/3 604ms
#98 GLM 5 none Z.ai 7.7 6.1 2/3 1.91s
#106 Grok 4.20 Beta none X AI 7.7 5.8 2/3 586ms
#112 GLM 5.1 none Z.ai 7.7 5.7 2/3 1.45s
#45 GPT-5.4 Mini medium OpenAI 7.8 7.5 2/3 4.37s
#67 MiniMax M3 medium Minimax 7.9 7.1 2/3 49.9s
#46 Qwen3.6 35B A3B medium Qwen 8.0 7.4 2/3 5.95s
#30 Qwen3.5-27B medium Qwen 8.2 7.8 2/3 59.6s
#21 GPT-5.4 medium OpenAI 8.2 8.0 2/3 9.14s

Topmodellen op Puzzeloplossing-score

Puzzeloplossing-score vs totale kosten

Topmodellen op Responstijd (gem.)