Clasament modele pentru Rezolvare de puzzle-uri

Vezi ce modele AI se descurcă cel mai bine la Rezolvare de puzzle-uri, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Timp de răspuns (mediu) ↓.

Modele afișate

Media pentru Scor Rezolvare de puzzle-uri

6.7

Cel mai bun model

Muse Spark 1.1 7.8

Motive de eșec

Cu motivul de eșec Răspuns greșit204 Cu motivul de eșec Nu a urmat instrucțiunile90 Cu motivul de eșec Eroare API12 Cu motivul de eșec Formatare suplimentară8 Cu motivul de eșec Timp expirat5 Cu motivul de eșec Fără răspuns3

216/216

Rang	Model	Companie	Scor Rezolvare de puzzle-uri	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#114	Ring-2.6-1T medium	Inclusionai	5.9	6.3	$0.103	1/3	20.7s
Total teste 3 Teste greșite 2 Cost total $0.103 Timp de răspuns (mediu) 20.7s
#134	GPT-5 Nano medium	OpenAI	5.3	6.1	$0.114	1/3	20.6s
Total teste 3 Teste greșite 2 Cost total $0.114 Timp de răspuns (mediu) 20.6s
#107	MiMo-V2.5 medium	Xiaomi	8.2	6.5	$0.082	2/3	20.3s
Total teste 3 Teste greșite 1 Cost total $0.082 Timp de răspuns (mediu) 20.3s
#143	North Mini Code medium	Cohere	3.3	5.9	$0.000	0/3	19.7s
Total teste 3 Teste greșite 3 Cost total $0.000 Timp de răspuns (mediu) 19.7s
#52	Grok Build 0.1 medium	X AI	7.7	7.6	$1.097	2/3	18.3s
Total teste 3 Teste greșite 1 Cost total $1.097 Timp de răspuns (mediu) 18.3s
#76	Qwen3.5-122B-A10B medium	Qwen	10.0	7.1	$1.046	3/3	17.9s
Total teste 3 Teste greșite 0 Cost total $1.046 Timp de răspuns (mediu) 17.9s
#74	Qwen3.5 Plus 2026-04-20 medium	Qwen	8.2	7.2	$0.317	2/3	17.7s
Total teste 3 Teste greșite 1 Cost total $0.317 Timp de răspuns (mediu) 17.7s
#40	Qwen3.7 Plus medium	Qwen	10.0	7.9	$0.267	3/3	16.4s
Total teste 3 Teste greșite 0 Cost total $0.267 Timp de răspuns (mediu) 16.4s
#29	GPT-5 Mini medium	OpenAI	5.6	8.1	$0.237	1/3	15.2s
Total teste 3 Teste greșite 2 Cost total $0.237 Timp de răspuns (mediu) 15.2s
#48	GPT-5.6 Luna high	OpenAI	7.6	7.7	$1.017	2/3	14.6s
Total teste 3 Teste greșite 1 Cost total $1.017 Timp de răspuns (mediu) 14.6s
#42	GLM 5.2 medium	Z.ai	8.2	7.8	$0.187	2/3	13.1s
Total teste 3 Teste greșite 1 Cost total $0.187 Timp de răspuns (mediu) 13.1s
#200	GLM 4.7 Flash medium	Z.ai	2.9	4.3	$0.166	0/3	12.9s
Total teste 3 Teste greșite 3 Cost total $0.166 Timp de răspuns (mediu) 12.9s
#194	Cobuddy medium	Baidu	3.6	4.7	$0.000	0/3	12.8s
Total teste 3 Teste greșite 3 Cost total $0.000 Timp de răspuns (mediu) 12.8s
#46	GLM 5 medium	Z.ai	10.0	7.7	$0.307	3/3	11.3s
Total teste 3 Teste greșite 0 Cost total $0.307 Timp de răspuns (mediu) 11.3s
#196	MiniMax M2.5 medium	Minimax	5.3	4.6	$0.340	1/3	11.2s
Total teste 3 Teste greșite 2 Cost total $0.340 Timp de răspuns (mediu) 11.2s

Clasament Rezolvare de puzzle-uri

Filtrează modelele

Top modele după Scor Rezolvare de puzzle-uri

Scor Rezolvare de puzzle-uri vs cost total

Top modele după Timp de răspuns (mediu)