Clasament modele pentru Combinat

Vezi ce modele AI se descurcă cel mai bine la Combinat, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Teste corecte ↑.

Modele afișate

Media pentru Scor Combinat

5.6

Cel mai bun model

Muse Spark 1.1 5.9

Motive de eșec

Cu motivul de eșec Apel de instrument invalid91 Cu motivul de eșec Răspuns greșit69 Cu motivul de eșec Fără răspuns32 Cu motivul de eșec Eroare API26 Cu motivul de eșec Timp expirat5 Cu motivul de eșec Formatare suplimentară1 Cu motivul de eșec Nu a urmat instrucțiunile1

216/216

Rang	Model	Companie	Scor Combinat	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#183	Nemotron 3 Super none	NVIDIA	3.0	4.9	$0.008	0/2	18.2s
Total teste 2 Teste greșite 2 Cost total $0.008 Timp de răspuns (mediu) 18.2s
#184	Ling-2.6-flash none	Inclusionai	3.0	4.9	$0.002	0/2	35.7s
Total teste 2 Teste greșite 2 Cost total $0.002 Timp de răspuns (mediu) 35.7s
#185	Ring-2.6-1T none	Inclusionai	3.0	4.8	$0.026	0/2	0ms
Total teste 2 Teste greșite 2 Cost total $0.026 Timp de răspuns (mediu) 0ms
#186	GPT-5.4 Nano none	OpenAI	3.0	4.8	$0.041	0/2	14.7s
Total teste 2 Teste greșite 2 Cost total $0.041 Timp de răspuns (mediu) 14.7s
#187	Grok 4.20 Multi Agent Beta medium	X AI	1.5	4.8	$5.599	0/1	0ms
Total teste 1 Teste greșite 1 Cost total $5.599 Timp de răspuns (mediu) 0ms
#188	KAT-Coder-Air V2.5 none	Kwaipilot	3.8	4.8	$0.067	0/2	73.0s
Total teste 2 Teste greșite 2 Cost total $0.067 Timp de răspuns (mediu) 73.0s
#189	Trinity Large Preview none	Arcee AI	1.5	4.8	$0.008	0/1	8.91s
Total teste 1 Teste greșite 1 Cost total $0.008 Timp de răspuns (mediu) 8.91s
#190	Hunter Alpha medium	OpenRouter	2.3	4.7	$0.000	0/1	30.5s
Total teste 1 Teste greșite 1 Cost total $0.000 Timp de răspuns (mediu) 30.5s
#192	Laguna M.1 medium	Poolside	1.5	4.7	$0.033	0/1	53.1s
Total teste 1 Teste greșite 1 Cost total $0.033 Timp de răspuns (mediu) 53.1s
#193	Qwen3 Coder Next medium	Qwen	3.0	4.7	$0.032	0/2	14.6s
Total teste 2 Teste greșite 2 Cost total $0.032 Timp de răspuns (mediu) 14.6s
#194	Cobuddy medium	Baidu	1.5	4.7	$0.000	0/1	47.4s
Total teste 1 Teste greșite 1 Cost total $0.000 Timp de răspuns (mediu) 47.4s
#195	Mercury 2 none	Inception	3.0	4.6	$0.030	0/2	2.56s
Total teste 2 Teste greșite 2 Cost total $0.030 Timp de răspuns (mediu) 2.56s
#196	MiniMax M2.5 medium	Minimax	3.7	4.6	$0.340	0/2	83.2s
Total teste 2 Teste greșite 2 Cost total $0.340 Timp de răspuns (mediu) 83.2s
#197	Grok 4.20 Beta none	X AI	1.5	4.4	$0.087	0/1	6.48s
Total teste 1 Teste greșite 1 Cost total $0.087 Timp de răspuns (mediu) 6.48s
#198	Laguna M.1 none	Poolside	1.5	4.4	$0.009	0/1	4.32s
Total teste 1 Teste greșite 1 Cost total $0.009 Timp de răspuns (mediu) 4.32s

Clasament Combinat

Filtrează modelele

Top modele după Scor Combinat

Scor Combinat vs cost total

Top modele după Timp de răspuns (mediu)