Clasament modele pentru Combinat

Vezi ce modele AI se descurcă cel mai bine la Combinat, care rămân fiabile și unde apar cele mai mari diferențe.

Modele afișate

Media pentru Scor Combinat

5.4

Cel mai bun model

Motive de eșec

Cu motivul de eșec Apel de instrument invalid91 Cu motivul de eșec Răspuns greșit67 Cu motivul de eșec Fără răspuns29 Cu motivul de eșec Eroare API25 Cu motivul de eșec Timp expirat5 Cu motivul de eșec Formatare suplimentară1 Cu motivul de eșec Nu a urmat instrucțiunile1

206/206

Rang	Model	Companie	Scor Combinat	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#1	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	2/2	26.7s
Total teste 2 Teste greșite 0 Cost total $0.742 Timp de răspuns (mediu) 26.7s
#3	GPT-5.6 Sol low	OpenAI	10.0	9.5	$0.971	2/2	14.6s
Total teste 2 Teste greșite 0 Cost total $0.971 Timp de răspuns (mediu) 14.6s
#4	GPT-5.6 Sol medium	OpenAI	10.0	9.4	$1.316	2/2	17.6s
Total teste 2 Teste greșite 0 Cost total $1.316 Timp de răspuns (mediu) 17.6s
#5	GPT-5.6 Sol high	OpenAI	10.0	9.4	$1.234	2/2	25.0s
Total teste 2 Teste greșite 0 Cost total $1.234 Timp de răspuns (mediu) 25.0s
#6	GPT-5.5 low	OpenAI	10.0	9.3	$1.253	2/2	13.7s
Total teste 2 Teste greșite 0 Cost total $1.253 Timp de răspuns (mediu) 13.7s
#9	Gemini 3.5 Flash medium	Google	10.0	9.1	$0.642	2/2	44.4s
Total teste 2 Teste greșite 0 Cost total $0.642 Timp de răspuns (mediu) 44.4s
#10	GPT-5.5 medium	OpenAI	10.0	9.0	$4.137	2/2	33.5s
Total teste 2 Teste greșite 0 Cost total $4.137 Timp de răspuns (mediu) 33.5s
#12	Grok 4.5 high	X AI	10.0	8.9	$1.707	2/2	35.6s
Total teste 2 Teste greșite 0 Cost total $1.707 Timp de răspuns (mediu) 35.6s
#13	GPT-5.3-Codex medium	OpenAI	10.0	8.9	$0.920	2/2	26.0s
Total teste 2 Teste greșite 0 Cost total $0.920 Timp de răspuns (mediu) 26.0s
#15	Claude Opus 4.7 medium	Anthropic	10.0	8.7	$1.477	2/2	43.4s
Total teste 2 Teste greșite 0 Cost total $1.477 Timp de răspuns (mediu) 43.4s
#18	GPT-5.4 medium	OpenAI	10.0	8.5	$1.533	2/2	29.8s
Total teste 2 Teste greșite 0 Cost total $1.533 Timp de răspuns (mediu) 29.8s
#21	GPT-5.2 medium	OpenAI	10.0	8.4	$0.951	2/2	58.5s
Total teste 2 Teste greșite 0 Cost total $0.951 Timp de răspuns (mediu) 58.5s
#22	Grok 4.5 medium	X AI	10.0	8.3	$1.928	2/2	29.0s
Total teste 2 Teste greșite 0 Cost total $1.928 Timp de răspuns (mediu) 29.0s
#25	Gemini 2.5 Flash medium	Google	10.0	8.2	$0.643	2/2	84.5s
Total teste 2 Teste greșite 0 Cost total $0.643 Timp de răspuns (mediu) 84.5s
#31	GLM 5.2 high	Z.ai	10.0	8.0	$0.296	2/2	321.5s
Total teste 2 Teste greșite 0 Cost total $0.296 Timp de răspuns (mediu) 321.5s

Clasament Combinat

Filtrează modelele

Top modele după Scor Combinat

Scor Combinat vs cost total

Top modele după Timp de răspuns (mediu)