Clasament modele pentru Apelare instrumente

Vezi ce modele AI se descurcă cel mai bine la Apelare instrumente, care rămân fiabile și unde apar cele mai mari diferențe.

Modele afișate

Media pentru Scor Apelare instrumente

8.7

Cel mai bun model

Gemini 3 Flash Preview 10.0

Motive de eșec

Cu motivul de eșec Eroare API17 Cu motivul de eșec Apel de instrument invalid9 Cu motivul de eșec Nu a urmat instrucțiunile8 Cu motivul de eșec Răspuns greșit3 Cu motivul de eșec Fără răspuns2

210/210

Rang	Model	Companie	Scor Apelare instrumente	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#18	GPT-5.4 medium	OpenAI	10.0	8.5	$1.533	1/1	13.3s
Total teste 1 Teste greșite 0 Cost total $1.533 Timp de răspuns (mediu) 13.3s
#19	Qwen3.6 Max Preview medium	Qwen	10.0	8.4	$1.143	1/1	18.3s
Total teste 1 Teste greșite 0 Cost total $1.143 Timp de răspuns (mediu) 18.3s
#20	Grok 4.5 low	X AI	10.0	8.4	$0.935	1/1	5.83s
Total teste 1 Teste greșite 0 Cost total $0.935 Timp de răspuns (mediu) 5.83s
#22	Grok 4.5 medium	X AI	10.0	8.3	$1.928	1/1	6.57s
Total teste 1 Teste greșite 0 Cost total $1.928 Timp de răspuns (mediu) 6.57s
#23	Claude Sonnet 5 medium	Anthropic	10.0	8.3	$0.922	1/1	10.7s
Total teste 1 Teste greșite 0 Cost total $0.922 Timp de răspuns (mediu) 10.7s
#25	Gemini 2.5 Flash medium	Google	10.0	8.2	$0.643	1/1	6.20s
Total teste 1 Teste greșite 0 Cost total $0.643 Timp de răspuns (mediu) 6.20s
#26	GPT-5 Mini medium	OpenAI	10.0	8.1	$0.237	1/1	18.6s
Total teste 1 Teste greșite 0 Cost total $0.237 Timp de răspuns (mediu) 18.6s
#29	Step 3.7 Flash medium	Stepfun	10.0	8.0	$0.515	1/1	4.16s
Total teste 1 Teste greșite 0 Cost total $0.515 Timp de răspuns (mediu) 4.16s
#30	GPT-5.2 Chat none	OpenAI	10.0	8.0	$0.604	1/1	4.68s
Total teste 1 Teste greșite 0 Cost total $0.604 Timp de răspuns (mediu) 4.68s
#31	GLM 5.2 high	Z.ai	10.0	8.0	$0.970	1/1	9.25s
Total teste 1 Teste greșite 0 Cost total $0.970 Timp de răspuns (mediu) 9.25s
#34	GPT-5.6 Terra high	OpenAI	10.0	8.0	$1.055	1/1	4.97s
Total teste 1 Teste greșite 0 Cost total $1.055 Timp de răspuns (mediu) 4.97s
#35	Seed-2.0-Lite medium	Bytedance Seed	10.0	7.9	$0.234	1/1	12.4s
Total teste 1 Teste greșite 0 Cost total $0.234 Timp de răspuns (mediu) 12.4s
#36	Qwen3.7 Plus medium	Qwen	10.0	7.9	$0.267	1/1	15.0s
Total teste 1 Teste greșite 0 Cost total $0.267 Timp de răspuns (mediu) 15.0s
#37	Qwen3.6 Plus medium	Qwen	10.0	7.8	$0.405	1/1	5.87s
Total teste 1 Teste greșite 0 Cost total $0.405 Timp de răspuns (mediu) 5.87s
#38	GLM 5.2 medium	Z.ai	10.0	7.8	$0.222	1/1	20.4s
Total teste 1 Teste greșite 0 Cost total $0.222 Timp de răspuns (mediu) 20.4s

Clasament Apelare instrumente

Filtrează modelele

Top modele după Scor Apelare instrumente

Scor Apelare instrumente vs cost total

Top modele după Timp de răspuns (mediu)