Clasament modele pentru Programare

Categorie AI BENCHY

Vezi ce modele AI se descurcă cel mai bine la Programare, care rămân fiabile și unde apar cele mai mari diferențe.

Modele afișate

Media pentru Scor Programare

5.7

Cel mai bun model

Motive de eșec

Cu motivul de eșec Răspuns greșit230 Cu motivul de eșec Eroare API43 Cu motivul de eșec Timp expirat25 Cu motivul de eșec Fără răspuns18 Cu motivul de eșec Nu a urmat instrucțiunile16 Cu motivul de eșec Formatare suplimentară12

189/189

Rang	Model	Companie	Scor Programare	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#1	Gemini 3.5 Flash high	Google	10.0	9.8	$1.115	3/3	23.0s
Total teste 3 Teste greșite 0 Cost total $1.115 Timp de răspuns (mediu) 23.0s
#3	GPT-5.6 Sol low	OpenAI	10.0	9.5	$0.649	3/3	11.3s
Total teste 3 Teste greșite 0 Cost total $0.649 Timp de răspuns (mediu) 11.3s
#4	Qwen3.7 Max medium	Qwen	10.0	9.4	$0.523	3/3	35.3s
Total teste 3 Teste greșite 0 Cost total $0.523 Timp de răspuns (mediu) 35.3s
#5	GPT-5.6 Sol medium	OpenAI	10.0	9.4	$0.966	3/3	9.40s
Total teste 3 Teste greșite 0 Cost total $0.966 Timp de răspuns (mediu) 9.40s
#6	GPT-5.6 Sol high	OpenAI	10.0	9.4	$0.821	3/3	12.5s
Total teste 3 Teste greșite 0 Cost total $0.821 Timp de răspuns (mediu) 12.5s
#7	GPT-5.5 low	OpenAI	10.0	9.3	$0.907	3/3	15.0s
Total teste 3 Teste greșite 0 Cost total $0.907 Timp de răspuns (mediu) 15.0s
#9	Claude Fable 5 medium	Anthropic	10.0	9.2	$3.165	3/3	15.6s
Total teste 3 Teste greșite 0 Cost total $3.165 Timp de răspuns (mediu) 15.6s
#13	GPT-5.3-Codex medium	OpenAI	10.0	8.9	$0.740	3/3	19.5s
Total teste 3 Teste greșite 0 Cost total $0.740 Timp de răspuns (mediu) 19.5s
#15	Claude Opus 4.8 medium	Anthropic	10.0	8.8	$1.107	3/3	15.3s
Total teste 3 Teste greșite 0 Cost total $1.107 Timp de răspuns (mediu) 15.3s
#18	GLM 5 medium	Z.ai	10.0	8.6	$0.228	3/3	74.3s
Total teste 3 Teste greșite 0 Cost total $0.228 Timp de răspuns (mediu) 74.3s
#19	GPT-5 Mini medium	OpenAI	10.0	8.5	$0.159	3/3	27.6s
Total teste 3 Teste greșite 0 Cost total $0.159 Timp de răspuns (mediu) 27.6s
#25	GPT-5.2 medium	OpenAI	10.0	8.4	$0.548	3/3	22.7s
Total teste 3 Teste greșite 0 Cost total $0.548 Timp de răspuns (mediu) 22.7s
#40	Grok 4.5 low	X AI	10.0	7.8	$0.760	3/3	13.7s
Total teste 3 Teste greșite 0 Cost total $0.760 Timp de răspuns (mediu) 13.7s
#130	Qwen3.6 Plus Preview medium	Qwen	9.8	5.8	$0.000	0/1	0ms
Total teste 1 Teste greșite 1 Cost total $0.000 Timp de răspuns (mediu) 0ms
#152	Hunter Alpha medium	OpenRouter	9.8	5.1	$0.000	0/1	0ms
Total teste 1 Teste greșite 1 Cost total $0.000 Timp de răspuns (mediu) 0ms

Clasament Programare

Filtrează modelele

Top modele după Scor Programare

Scor Programare vs cost total

Top modele după Timp de răspuns (mediu)