Clasament modele pentru Apelare instrumente

Vezi ce modele AI se descurcă cel mai bine la Apelare instrumente, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Teste corecte ↑.

Modele afișate

Media pentru Scor Apelare instrumente

8.7

Cel mai bun model

GPT-5.2 4.7

Motive de eșec

Cu motivul de eșec Eroare API17 Cu motivul de eșec Apel de instrument invalid9 Cu motivul de eșec Nu a urmat instrucțiunile8 Cu motivul de eșec Răspuns greșit3 Cu motivul de eșec Fără răspuns2

210/210

Rang	Model	Companie	Scor Apelare instrumente	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#21	GPT-5.2 medium	OpenAI	4.7	8.4	$0.951	0/1	10.3s
Total teste 1 Teste greșite 1 Cost total $0.951 Timp de răspuns (mediu) 10.3s
#28	Inkling high	Thinkingmachines	3.0	8.0	$1.006	0/1	6.52s
Total teste 1 Teste greșite 1 Cost total $1.006 Timp de răspuns (mediu) 6.52s
#32	Inkling medium	Thinkingmachines	3.0	8.0	$0.391	0/1	4.48s
Total teste 1 Teste greșite 1 Cost total $0.391 Timp de răspuns (mediu) 4.48s
#33	Kimi K3 max	Moonshot AI	3.0	8.0	$3.112	0/1	0ms
Total teste 1 Teste greșite 1 Cost total $3.112 Timp de răspuns (mediu) 0ms
#52	Kimi K2.7 Code medium	Moonshot AI	3.0	7.5	$0.751	0/1	0ms
Total teste 1 Teste greșite 1 Cost total $0.751 Timp de răspuns (mediu) 0ms
#55	GPT-5.6 Terra low	OpenAI	4.7	7.5	$0.519	0/1	6.69s
Total teste 1 Teste greșite 1 Cost total $0.519 Timp de răspuns (mediu) 6.69s
#56	GPT-5.4 Mini medium	OpenAI	4.7	7.5	$0.756	0/1	9.62s
Total teste 1 Teste greșite 1 Cost total $0.756 Timp de răspuns (mediu) 9.62s
#74	GLM 5.1 medium	Z.ai	3.0	7.1	$0.535	0/1	0ms
Total teste 1 Teste greșite 1 Cost total $0.535 Timp de răspuns (mediu) 0ms
#75	Grok 4.20 medium	X AI	3.0	7.1	$0.777	0/1	13.7s
Total teste 1 Teste greșite 1 Cost total $0.777 Timp de răspuns (mediu) 13.7s
#79	Gemini 3.5 Flash none	Google	3.0	7.0	$1.079	0/1	0ms
Total teste 1 Teste greșite 1 Cost total $1.079 Timp de răspuns (mediu) 0ms
#90	Qwen3.6 35B A3B medium	Qwen	3.0	6.7	$0.746	0/1	0ms
Total teste 1 Teste greșite 1 Cost total $0.746 Timp de răspuns (mediu) 0ms
#93	GLM 5V Turbo medium	Z.ai	7.0	6.7	$0.457	0/1	12.5s
Total teste 1 Teste greșite 1 Cost total $0.457 Timp de răspuns (mediu) 12.5s
#110	Gemma 4 31B medium	Google	3.0	6.3	$0.163	0/1	0ms
Total teste 1 Teste greșite 1 Cost total $0.163 Timp de răspuns (mediu) 0ms
#115	Gemma 4 31B none	Google	3.0	6.2	$0.035	0/1	0ms
Total teste 1 Teste greșite 1 Cost total $0.035 Timp de răspuns (mediu) 0ms
#123	Inkling low	Thinkingmachines	3.0	6.1	$0.187	0/1	2.57s
Total teste 1 Teste greșite 1 Cost total $0.187 Timp de răspuns (mediu) 2.57s

Clasament Apelare instrumente

Filtrează modelele

Top modele după Scor Apelare instrumente

Scor Apelare instrumente vs cost total

Top modele după Timp de răspuns (mediu)