Clasament modele pentru Rezolvare de puzzle-uri

Vezi ce modele AI se descurcă cel mai bine la Rezolvare de puzzle-uri, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Teste corecte ↑.

Modele afișate

Media pentru Scor Rezolvare de puzzle-uri

6.7

Cel mai bun model

GPT-5.4 Nano 4.1

Motive de eșec

Cu motivul de eșec Răspuns greșit201 Cu motivul de eșec Nu a urmat instrucțiunile90 Cu motivul de eșec Eroare API12 Cu motivul de eșec Formatare suplimentară8 Cu motivul de eșec Timp expirat5 Cu motivul de eșec Fără răspuns3

210/210

Rang	Model	Companie	Scor Rezolvare de puzzle-uri	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#158	KAT-Coder-Air V2.5 low	Kwaipilot	3.1	5.4	$0.041	0/3	1.57s
Total teste 3 Teste greșite 3 Cost total $0.041 Timp de răspuns (mediu) 1.57s
#160	Laguna XS 2.1 none	Poolside	3.0	5.3	$0.008	0/3	1.01s
Total teste 3 Teste greșite 3 Cost total $0.008 Timp de răspuns (mediu) 1.01s
#161	Qwen3.6 35B A3B none	Qwen	3.2	5.3	$0.061	0/3	1.07s
Total teste 3 Teste greșite 3 Cost total $0.061 Timp de răspuns (mediu) 1.07s
#162	Ling-2.6-1T none	Inclusionai	3.1	5.3	$0.016	0/3	5.36s
Total teste 3 Teste greșite 3 Cost total $0.016 Timp de răspuns (mediu) 5.36s
#165	Mistral Small 4 none	Mistral	3.1	5.1	$0.022	0/3	399ms
Total teste 3 Teste greșite 3 Cost total $0.022 Timp de răspuns (mediu) 399ms
#166	Qwen3 Coder Next none	Qwen	3.0	5.1	$0.025	0/3	24.3s
Total teste 3 Teste greșite 3 Cost total $0.025 Timp de răspuns (mediu) 24.3s
#167	Mistral Small 4 medium	Mistral	3.4	5.1	$0.096	0/3	2.17s
Total teste 3 Teste greșite 3 Cost total $0.096 Timp de răspuns (mediu) 2.17s
#169	Qwen3.5-9B none	Qwen	3.2	5.1	$0.021	0/3	621ms
Total teste 3 Teste greșite 3 Cost total $0.021 Timp de răspuns (mediu) 621ms
#171	North Mini Code none	Cohere	3.5	5.1	$0.000	0/3	24.4s
Total teste 3 Teste greșite 3 Cost total $0.000 Timp de răspuns (mediu) 24.4s
#174	GPT-4o-mini none	OpenAI	3.5	5.0	$0.010	0/3	1.21s
Total teste 3 Teste greșite 3 Cost total $0.010 Timp de răspuns (mediu) 1.21s
#178	Ling-2.6-flash none	Inclusionai	2.9	4.9	$0.002	0/3	6.51s
Total teste 3 Teste greșite 3 Cost total $0.002 Timp de răspuns (mediu) 6.51s
#182	KAT-Coder-Air V2.5 none	Kwaipilot	2.9	4.8	$0.067	0/3	1.84s
Total teste 3 Teste greșite 3 Cost total $0.067 Timp de răspuns (mediu) 1.84s
#183	Trinity Large Preview none	Arcee AI	3.6	4.8	$0.008	0/3	1.97s
Total teste 3 Teste greșite 3 Cost total $0.008 Timp de răspuns (mediu) 1.97s
#187	Qwen3 Coder Next medium	Qwen	3.0	4.7	$0.032	0/3	1.25s
Total teste 3 Teste greșite 3 Cost total $0.032 Timp de răspuns (mediu) 1.25s
#188	Cobuddy medium	Baidu	3.6	4.7	$0.000	0/3	12.8s
Total teste 3 Teste greșite 3 Cost total $0.000 Timp de răspuns (mediu) 12.8s

Clasament Rezolvare de puzzle-uri

Filtrează modelele

Top modele după Scor Rezolvare de puzzle-uri

Scor Rezolvare de puzzle-uri vs cost total

Top modele după Timp de răspuns (mediu)