Clasament modele pentru Combinat

Vezi ce modele AI se descurcă cel mai bine la Combinat, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Teste corecte ↑.

Modele afișate

Media pentru Scor Combinat

5.6

Cel mai bun model

Muse Spark 1.1 5.9

Motive de eșec

Cu motivul de eșec Apel de instrument invalid91 Cu motivul de eșec Răspuns greșit69 Cu motivul de eșec Fără răspuns32 Cu motivul de eșec Eroare API26 Cu motivul de eșec Timp expirat5 Cu motivul de eșec Formatare suplimentară1 Cu motivul de eșec Nu a urmat instrucțiunile1

216/216

Rang	Model	Companie	Scor Combinat	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#199	Elephant Alpha none	Openrouter	1.5	4.3	$0.000	0/1	3.81s
Total teste 1 Teste greșite 1 Cost total $0.000 Timp de răspuns (mediu) 3.81s
#200	GLM 4.7 Flash medium	Z.ai	2.9	4.3	$0.166	0/2	802.8s
Total teste 2 Teste greșite 2 Cost total $0.166 Timp de răspuns (mediu) 802.8s
#201	Elephant Alpha medium	Openrouter	1.5	4.3	$0.000	0/1	3.70s
Total teste 1 Teste greșite 1 Cost total $0.000 Timp de răspuns (mediu) 3.70s
#202	Hunter Alpha none	OpenRouter	1.5	4.2	$0.000	0/1	15.2s
Total teste 1 Teste greșite 1 Cost total $0.000 Timp de răspuns (mediu) 15.2s
#203	Grok 4.20 none	X AI	1.5	4.1	$0.057	0/1	6.04s
Total teste 1 Teste greșite 1 Cost total $0.057 Timp de răspuns (mediu) 6.04s
#204	Laguna Xs.2 medium	Poolside	1.5	4.1	$0.015	0/1	15.9s
Total teste 1 Teste greșite 1 Cost total $0.015 Timp de răspuns (mediu) 15.9s
#205	Hy3 preview none	Tencent	1.5	4.0	$0.003	0/1	35.8s
Total teste 1 Teste greșite 1 Cost total $0.003 Timp de răspuns (mediu) 35.8s
#206	MiMo-V2-Flash none	Xiaomi	1.5	4.0	$0.025	0/1	2.87s
Total teste 1 Teste greșite 1 Cost total $0.025 Timp de răspuns (mediu) 2.87s
#207	Granite 4.1 8B none	IBM Granite	3.0	4.0	$0.007	0/2	9.28s
Total teste 2 Teste greșite 2 Cost total $0.007 Timp de răspuns (mediu) 9.28s
#208	Grok Build 0.1 none	X AI	1.5	4.0	$0.547	0/1	0ms
Total teste 1 Teste greșite 1 Cost total $0.547 Timp de răspuns (mediu) 0ms
#209	Grok 4.1 Fast none	X AI	1.5	3.8	$0.008	0/1	3.33s
Total teste 1 Teste greșite 1 Cost total $0.008 Timp de răspuns (mediu) 3.33s
#210	Qwen3.5-9B medium	Qwen	3.0	3.8	$0.036	0/2	0ms
Total teste 2 Teste greșite 2 Cost total $0.036 Timp de răspuns (mediu) 0ms
#211	Laguna Xs.2 none	Poolside	1.5	3.8	$0.004	0/1	2.01s
Total teste 1 Teste greșite 1 Cost total $0.004 Timp de răspuns (mediu) 2.01s
#212	gpt-oss-120b none	OpenAI	1.5	3.7	$0.010	0/1	0ms
Total teste 1 Teste greșite 1 Cost total $0.010 Timp de răspuns (mediu) 0ms
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1.5	3.4	$0.000	0/1	0ms
Total teste 1 Teste greșite 1 Cost total $0.000 Timp de răspuns (mediu) 0ms

Clasament Combinat

Filtrează modelele

Top modele după Scor Combinat

Scor Combinat vs cost total

Top modele după Timp de răspuns (mediu)