Clasament modele pentru Combinat

Vezi ce modele AI se descurcă cel mai bine la Combinat, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Timp de răspuns (mediu) ↓.

Modele afișate

Media pentru Scor Combinat

5.6

Cel mai bun model

Qwen3.6 35B A3B 3.0

Motive de eșec

Cu motivul de eșec Apel de instrument invalid91 Cu motivul de eșec Răspuns greșit69 Cu motivul de eșec Fără răspuns32 Cu motivul de eșec Eroare API26 Cu motivul de eșec Timp expirat5 Cu motivul de eșec Formatare suplimentară1 Cu motivul de eșec Nu a urmat instrucțiunile1

216/216

Rang	Model	Companie	Scor Combinat	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#99	Claude Opus 4.7 none	Anthropic	4.8	6.6	$0.505	1/1	18.3s
Total teste 1 Teste greșite 0 Cost total $0.505 Timp de răspuns (mediu) 18.3s
#183	Nemotron 3 Super none	NVIDIA	3.0	4.9	$0.008	0/2	18.2s
Total teste 2 Teste greșite 2 Cost total $0.008 Timp de răspuns (mediu) 18.2s
#7	GPT-5.6 Sol medium	OpenAI	10.0	9.4	$1.316	2/2	17.6s
Total teste 2 Teste greșite 0 Cost total $1.316 Timp de răspuns (mediu) 17.6s
#6	Gemini 3.6 Flash low	Google	10.0	9.4	$0.517	2/2	17.3s
Total teste 2 Teste greșite 0 Cost total $0.517 Timp de răspuns (mediu) 17.3s
#68	Gemini 3.1 Flash Lite Preview medium	Google	7.2	7.3	$0.115	1/2	16.6s
Total teste 2 Teste greșite 1 Cost total $0.115 Timp de răspuns (mediu) 16.6s
#204	Laguna Xs.2 medium	Poolside	1.5	4.1	$0.015	0/1	15.9s
Total teste 1 Teste greșite 1 Cost total $0.015 Timp de răspuns (mediu) 15.9s
#202	Hunter Alpha none	OpenRouter	1.5	4.2	$0.000	0/1	15.2s
Total teste 1 Teste greșite 1 Cost total $0.000 Timp de răspuns (mediu) 15.2s
#58	GPT-5.3 Chat none	OpenAI	10.0	7.5	$0.571	2/2	15.1s
Total teste 2 Teste greșite 0 Cost total $0.571 Timp de răspuns (mediu) 15.1s
#98	GLM 5V Turbo medium	Z.ai	3.4	6.7	$0.457	0/1	15.1s
Total teste 1 Teste greșite 1 Cost total $0.457 Timp de răspuns (mediu) 15.1s
#186	GPT-5.4 Nano none	OpenAI	3.0	4.8	$0.041	0/2	14.7s
Total teste 2 Teste greșite 2 Cost total $0.041 Timp de răspuns (mediu) 14.7s
#193	Qwen3 Coder Next medium	Qwen	3.0	4.7	$0.032	0/2	14.6s
Total teste 2 Teste greșite 2 Cost total $0.032 Timp de răspuns (mediu) 14.6s
#54	GPT-5.6 Luna medium	OpenAI	10.0	7.6	$0.352	2/2	14.6s
Total teste 2 Teste greșite 0 Cost total $0.352 Timp de răspuns (mediu) 14.6s
#5	GPT-5.6 Sol low	OpenAI	10.0	9.5	$0.971	2/2	14.6s
Total teste 2 Teste greșite 0 Cost total $0.971 Timp de răspuns (mediu) 14.6s
#92	Gemini 3.5 Flash minimal	Google	3.0	6.8	$0.300	0/2	14.4s
Total teste 2 Teste greșite 2 Cost total $0.300 Timp de răspuns (mediu) 14.4s
#34	GPT-5.2 Chat none	OpenAI	7.3	8.0	$0.604	1/2	13.9s
Total teste 2 Teste greșite 1 Cost total $0.604 Timp de răspuns (mediu) 13.9s

Clasament Combinat

Filtrează modelele

Top modele după Scor Combinat

Scor Combinat vs cost total

Top modele după Timp de răspuns (mediu)