Clasament modele pentru Rezolvare de puzzle-uri

Vezi ce modele AI se descurcă cel mai bine la Rezolvare de puzzle-uri, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Timp de răspuns (mediu) ↓.

Modele afișate

Media pentru Scor Rezolvare de puzzle-uri

6.7

Cel mai bun model

Muse Spark 1.1 7.8

Motive de eșec

Cu motivul de eșec Răspuns greșit204 Cu motivul de eșec Nu a urmat instrucțiunile90 Cu motivul de eșec Eroare API12 Cu motivul de eșec Formatare suplimentară8 Cu motivul de eșec Timp expirat5 Cu motivul de eșec Fără răspuns3

216/216

Rang	Model	Companie	Scor Rezolvare de puzzle-uri	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#115	Mimo V2 PRO medium	Xiaomi	6.4	6.3	$0.333	1/3	5.08s
Total teste 3 Teste greșite 2 Cost total $0.333 Timp de răspuns (mediu) 5.08s
#16	GPT-5.3-Codex medium	OpenAI	9.0	8.9	$0.920	2/3	5.05s
Total teste 3 Teste greșite 1 Cost total $0.920 Timp de răspuns (mediu) 5.05s
#9	GPT-5.5 low	OpenAI	10.0	9.3	$1.253	3/3	4.74s
Total teste 3 Teste greșite 0 Cost total $1.253 Timp de răspuns (mediu) 4.74s
#47	Claude Opus 4.6 medium	Anthropic	7.7	7.7	$3.059	2/3	4.71s
Total teste 3 Teste greșite 1 Cost total $3.059 Timp de răspuns (mediu) 4.71s
#205	Hy3 preview none	Tencent	3.1	4.0	$0.003	0/3	4.56s
Total teste 3 Teste greșite 3 Cost total $0.003 Timp de răspuns (mediu) 4.56s
#59	GPT-5.6 Terra low	OpenAI	10.0	7.5	$0.519	3/3	4.46s
Total teste 3 Teste greșite 0 Cost total $0.519 Timp de răspuns (mediu) 4.46s
#60	GPT-5.4 Mini medium	OpenAI	7.8	7.5	$0.756	2/3	4.37s
Total teste 3 Teste greșite 1 Cost total $0.756 Timp de răspuns (mediu) 4.37s
#121	Gemma 4 31B none	Google	6.5	6.2	$0.021	1/3	4.23s
Total teste 3 Teste greșite 2 Cost total $0.021 Timp de răspuns (mediu) 4.23s
#154	Owl Alpha none	Openrouter	5.4	5.6	$0.000	1/3	4.18s
Total teste 3 Teste greșite 2 Cost total $0.000 Timp de răspuns (mediu) 4.18s
#34	GPT-5.2 Chat none	OpenAI	7.7	8.0	$0.604	2/3	4.10s
Total teste 3 Teste greșite 1 Cost total $0.604 Timp de răspuns (mediu) 4.10s
#8	GPT-5.6 Sol high	OpenAI	10.0	9.4	$1.234	3/3	4.10s
Total teste 3 Teste greșite 0 Cost total $1.234 Timp de răspuns (mediu) 4.10s
#3	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	3/3	4.05s
Total teste 3 Teste greșite 0 Cost total $0.742 Timp de răspuns (mediu) 4.05s
#54	GPT-5.6 Luna medium	OpenAI	7.8	7.6	$0.352	2/3	4.04s
Total teste 3 Teste greșite 1 Cost total $0.352 Timp de răspuns (mediu) 4.04s
#161	Kimi K2.5 none	Moonshot AI	3.0	5.5	$0.127	0/3	4.04s
Total teste 3 Teste greșite 3 Cost total $0.127 Timp de răspuns (mediu) 4.04s
#17	Claude Opus 4.8 medium	Anthropic	10.0	8.8	$1.931	3/3	3.95s
Total teste 3 Teste greșite 0 Cost total $1.931 Timp de răspuns (mediu) 3.95s

Clasament Rezolvare de puzzle-uri

Filtrează modelele

Top modele după Scor Rezolvare de puzzle-uri

Scor Rezolvare de puzzle-uri vs cost total

Top modele după Timp de răspuns (mediu)