Clasament modele pentru Apelare instrumente

Vezi ce modele AI se descurcă cel mai bine la Apelare instrumente, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Timp de răspuns (mediu) ↓.

Modele afișate

Media pentru Scor Apelare instrumente

8.8

Cel mai bun model

Ring-2.6-1T 10.0

Motive de eșec

Cu motivul de eșec Eroare API17 Cu motivul de eșec Apel de instrument invalid9 Cu motivul de eșec Nu a urmat instrucțiunile8 Cu motivul de eșec Răspuns greșit3 Cu motivul de eșec Fără răspuns2

216/216

Rang	Model	Companie	Scor Apelare instrumente	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#24	GPT-5.2 medium	OpenAI	4.7	8.4	$0.951	0/1	10.3s
Total teste 1 Teste greșite 1 Cost total $0.951 Timp de răspuns (mediu) 10.3s
#102	LongCat 2.0 high	Meituan	10.0	6.6	$0.469	1/1	10.0s
Total teste 1 Teste greșite 0 Cost total $0.469 Timp de răspuns (mediu) 10.0s
#30	Muse Spark 1.1 high	Meta	9.6	8.1	$1.694	1/1	9.88s
Total teste 1 Teste greșite 0 Cost total $1.694 Timp de răspuns (mediu) 9.88s
#53	GLM 5 Turbo medium	Z.ai	10.0	7.6	$0.323	1/1	9.84s
Total teste 1 Teste greșite 0 Cost total $0.323 Timp de răspuns (mediu) 9.84s
#2	Gemini 3.6 Flash high	Google	10.0	9.7	$1.785	1/1	9.76s
Total teste 1 Teste greșite 0 Cost total $1.785 Timp de răspuns (mediu) 9.76s
#47	Claude Opus 4.6 medium	Anthropic	10.0	7.7	$3.059	1/1	9.73s
Total teste 1 Teste greșite 0 Cost total $3.059 Timp de răspuns (mediu) 9.73s
#60	GPT-5.4 Mini medium	OpenAI	4.7	7.5	$0.756	0/1	9.62s
Total teste 1 Teste greșite 1 Cost total $0.756 Timp de răspuns (mediu) 9.62s
#110	Gemini 3.1 Flash Lite Preview low	Google	10.0	6.5	$0.646	1/1	9.54s
Total teste 1 Teste greșite 0 Cost total $0.646 Timp de răspuns (mediu) 9.54s
#35	GLM 5.2 high	Z.ai	10.0	8.0	$0.817	1/1	9.25s
Total teste 1 Teste greșite 0 Cost total $0.817 Timp de răspuns (mediu) 9.25s
#100	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	1/1	9.01s
Total teste 1 Teste greșite 0 Cost total $0.089 Timp de răspuns (mediu) 9.01s
#17	Claude Opus 4.8 medium	Anthropic	10.0	8.8	$1.931	1/1	8.96s
Total teste 1 Teste greșite 0 Cost total $1.931 Timp de răspuns (mediu) 8.96s
#72	Kimi K2.6 medium	Moonshot AI	10.0	7.2	$1.036	1/1	8.92s
Total teste 1 Teste greșite 0 Cost total $1.036 Timp de răspuns (mediu) 8.92s
#1	Gemini 3.6 Flash medium	Google	10.0	9.9	$0.831	1/1	8.55s
Total teste 1 Teste greșite 0 Cost total $0.831 Timp de răspuns (mediu) 8.55s
#58	GPT-5.3 Chat none	OpenAI	10.0	7.5	$0.571	1/1	8.36s
Total teste 1 Teste greșite 0 Cost total $0.571 Timp de răspuns (mediu) 8.36s
#152	Owl Alpha medium	Openrouter	10.0	5.6	$0.000	1/1	8.26s
Total teste 1 Teste greșite 0 Cost total $0.000 Timp de răspuns (mediu) 8.26s

Clasament Apelare instrumente

Filtrează modelele

Top modele după Scor Apelare instrumente

Scor Apelare instrumente vs cost total

Top modele după Timp de răspuns (mediu)