Clasament modele pentru Apelare instrumente

Vezi ce modele AI se descurcă cel mai bine la Apelare instrumente, care rămân fiabile și unde apar cele mai mari diferențe.

Modele afișate

Media pentru Scor Apelare instrumente

8.8

Cel mai bun model

Gemini 3.6 Flash 10.0

Motive de eșec

Cu motivul de eșec Eroare API17 Cu motivul de eșec Apel de instrument invalid9 Cu motivul de eșec Nu a urmat instrucțiunile8 Cu motivul de eșec Răspuns greșit3 Cu motivul de eșec Fără răspuns2

216/216

Rang	Model	Companie	Scor Apelare instrumente	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#126	Gemini 3.1 Flash Lite minimal	Google	10.0	6.1	$0.047	1/1	3.51s
Total teste 1 Teste greșite 0 Cost total $0.047 Timp de răspuns (mediu) 3.51s
#128	Gemini 3.1 Flash Lite none	Google	10.0	6.1	$0.046	1/1	2.97s
Total teste 1 Teste greșite 0 Cost total $0.046 Timp de răspuns (mediu) 2.97s
#130	Qwen3.6 Flash none	Qwen	10.0	6.1	$0.062	1/1	2.49s
Total teste 1 Teste greșite 0 Cost total $0.062 Timp de răspuns (mediu) 2.49s
#131	Qwen3.5-Flash none	Qwen	10.0	6.1	$0.073	1/1	3.67s
Total teste 1 Teste greșite 0 Cost total $0.073 Timp de răspuns (mediu) 3.67s
#132	Qwen3.5 Plus 2026-04-20 none	Qwen	10.0	6.1	$0.122	1/1	4.42s
Total teste 1 Teste greșite 0 Cost total $0.122 Timp de răspuns (mediu) 4.42s
#133	Qwen3.5-35B-A3B none	Qwen	10.0	6.1	$0.106	1/1	2.30s
Total teste 1 Teste greșite 0 Cost total $0.106 Timp de răspuns (mediu) 2.30s
#134	GPT-5 Nano medium	OpenAI	10.0	6.1	$0.114	1/1	33.3s
Total teste 1 Teste greșite 0 Cost total $0.114 Timp de răspuns (mediu) 33.3s
#135	Nemotron 3 Ultra none	NVIDIA	10.0	6.1	$0.095	1/1	2.99s
Total teste 1 Teste greșite 0 Cost total $0.095 Timp de răspuns (mediu) 2.99s
#136	Step 3.5 Flash medium	Stepfun	10.0	6.0	$0.108	1/1	11.9s
Total teste 1 Teste greșite 0 Cost total $0.108 Timp de răspuns (mediu) 11.9s
#139	Gemini 3 PRO Preview medium	Google	10.0	6.0	$0.385	1/1	12.0s
Total teste 1 Teste greșite 0 Cost total $0.385 Timp de răspuns (mediu) 12.0s
#140	Mimo V2 Omni medium	Xiaomi	10.0	5.9	$0.683	1/1	14.0s
Total teste 1 Teste greșite 0 Cost total $0.683 Timp de răspuns (mediu) 14.0s
#141	Hy3 preview high	Tencent	10.0	5.9	$0.048	1/1	78.8s
Total teste 1 Teste greșite 0 Cost total $0.048 Timp de răspuns (mediu) 78.8s
#143	North Mini Code medium	Cohere	10.0	5.9	$0.000	1/1	3.93s
Total teste 1 Teste greșite 0 Cost total $0.000 Timp de răspuns (mediu) 3.93s
#144	Kimi K2.6 none	Moonshot AI	10.0	5.8	$0.184	1/1	4.46s
Total teste 1 Teste greșite 0 Cost total $0.184 Timp de răspuns (mediu) 4.46s
#145	GPT-5.4 none	OpenAI	10.0	5.8	$0.397	1/1	2.75s
Total teste 1 Teste greșite 0 Cost total $0.397 Timp de răspuns (mediu) 2.75s

Clasament Apelare instrumente

Filtrează modelele

Top modele după Scor Apelare instrumente

Scor Apelare instrumente vs cost total

Top modele după Timp de răspuns (mediu)