Clasament modele pentru Programare

Categorie AI BENCHY

Vezi ce modele AI se descurcă cel mai bine la Programare, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Metrică ↑.

Modele afișate

Media pentru Scor Programare

5.7

Cel mai bun model

Gemini 3.1 Flash Lite Preview 0.0

Motive de eșec

Cu motivul de eșec Răspuns greșit230 Cu motivul de eșec Eroare API43 Cu motivul de eșec Timp expirat25 Cu motivul de eșec Fără răspuns18 Cu motivul de eșec Nu a urmat instrucțiunile16 Cu motivul de eșec Formatare suplimentară12

189/189

Rang	Model	Companie	Scor Programare	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#145	Qwen3.5-122B-A10B none	Qwen	3.7	5.3	$0.020	0/3	2.77s
Total teste 3 Teste greșite 3 Cost total $0.020 Timp de răspuns (mediu) 2.77s
#74	GLM 5.2 none	Z.ai	3.7	7.1	$0.042	0/3	7.55s
Total teste 3 Teste greșite 3 Cost total $0.042 Timp de răspuns (mediu) 7.55s
#149	Mistral Small 4 none	Mistral	3.7	5.1	$0.007	0/3	901ms
Total teste 3 Teste greșite 3 Cost total $0.007 Timp de răspuns (mediu) 901ms
#173	Elephant Alpha medium	Openrouter	3.7	4.5	$0.000	0/3	1.30s
Total teste 3 Teste greșite 3 Cost total $0.000 Timp de răspuns (mediu) 1.30s
#84	Qwen3.5-Flash medium	Qwen	3.7	6.8	$0.080	0/3	58.9s
Total teste 3 Teste greșite 3 Cost total $0.080 Timp de răspuns (mediu) 58.9s
#139	Gemma 4 26B A4B none	Google	3.7	5.5	$0.004	0/3	4.16s
Total teste 3 Teste greșite 3 Cost total $0.004 Timp de răspuns (mediu) 4.16s
#168	Qwen3 Coder Next medium	Qwen	3.7	4.7	$0.008	0/3	924ms
Total teste 3 Teste greșite 3 Cost total $0.008 Timp de răspuns (mediu) 924ms
#160	Cobuddy medium	Baidu	3.7	4.9	$0.000	0/3	79.2s
Total teste 3 Teste greșite 3 Cost total $0.000 Timp de răspuns (mediu) 79.2s
#143	GPT-5.6 Luna none	OpenAI	3.8	5.3	$0.047	0/3	980ms
Total teste 3 Teste greșite 3 Cost total $0.047 Timp de răspuns (mediu) 980ms
#167	Ling-2.6-1T none	Inclusionai	3.8	4.7	$0.005	0/3	10.6s
Total teste 3 Teste greșite 3 Cost total $0.005 Timp de răspuns (mediu) 10.6s
#116	Qwen3.6 Max Preview none	Qwen	3.8	6.0	$0.075	0/3	3.12s
Total teste 3 Teste greșite 3 Cost total $0.075 Timp de răspuns (mediu) 3.12s
#134	GLM 5.1 none	Z.ai	3.9	5.6	$0.057	0/3	4.96s
Total teste 3 Teste greșite 3 Cost total $0.057 Timp de răspuns (mediu) 4.96s
#151	North Mini Code none	Cohere	3.9	5.1	$0.000	0/3	22.0s
Total teste 3 Teste greșite 3 Cost total $0.000 Timp de răspuns (mediu) 22.0s
#140	Qwen3.5 Plus 2026-04-20 none	Qwen	3.9	5.5	$0.032	0/3	1.69s
Total teste 3 Teste greșite 3 Cost total $0.032 Timp de răspuns (mediu) 1.69s
#141	GLM 5 Turbo none	Z.ai	3.9	5.3	$0.047	0/3	2.41s
Total teste 3 Teste greșite 3 Cost total $0.047 Timp de răspuns (mediu) 2.41s

Clasament Programare

Filtrează modelele

Top modele după Scor Programare

Scor Programare vs cost total

Top modele după Timp de răspuns (mediu)