Clasament modele pentru Apelare instrumente

Vezi ce modele AI se descurcă cel mai bine la Apelare instrumente, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Timp de răspuns (mediu) ↑.

Modele afișate

Media pentru Scor Apelare instrumente

8.8

Cel mai bun model

Kimi K3 3.0

Motive de eșec

Cu motivul de eșec Eroare API17 Cu motivul de eșec Apel de instrument invalid9 Cu motivul de eșec Nu a urmat instrucțiunile8 Cu motivul de eșec Răspuns greșit3 Cu motivul de eșec Fără răspuns2

216/216

Rang	Model	Companie	Scor Apelare instrumente	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#131	Qwen3.5-Flash none	Qwen	10.0	6.1	$0.073	1/1	3.67s
Total teste 1 Teste greșite 0 Cost total $0.073 Timp de răspuns (mediu) 3.67s
#87	GPT-5.6 Sol none	OpenAI	10.0	6.9	$0.524	1/1	3.70s
Total teste 1 Teste greșite 0 Cost total $0.524 Timp de răspuns (mediu) 3.70s
#68	Gemini 3.1 Flash Lite Preview medium	Google	10.0	7.3	$0.115	1/1	3.80s
Total teste 1 Teste greșite 0 Cost total $0.115 Timp de răspuns (mediu) 3.80s
#12	Gemini 3.5 Flash medium	Google	10.0	9.1	$0.642	1/1	3.81s
Total teste 1 Teste greșite 0 Cost total $0.642 Timp de răspuns (mediu) 3.81s
#91	GPT-5.5 none	OpenAI	10.0	6.9	$0.544	1/1	3.90s
Total teste 1 Teste greșite 0 Cost total $0.544 Timp de răspuns (mediu) 3.90s
#63	Qwen3.7 Max none	Qwen	10.0	7.4	$0.197	1/1	3.92s
Total teste 1 Teste greșite 0 Cost total $0.197 Timp de răspuns (mediu) 3.92s
#143	North Mini Code medium	Cohere	10.0	5.9	$0.000	1/1	3.93s
Total teste 1 Teste greșite 0 Cost total $0.000 Timp de răspuns (mediu) 3.93s
#122	Seed-2.0-Lite none	Bytedance Seed	10.0	6.2	$0.066	1/1	3.94s
Total teste 1 Teste greșite 0 Cost total $0.066 Timp de răspuns (mediu) 3.94s
#89	Qwen3.6 Flash medium	Qwen	10.0	6.9	$0.738	1/1	4.00s
Total teste 1 Teste greșite 0 Cost total $0.738 Timp de răspuns (mediu) 4.00s
#31	Gemini 3.5 Flash-Lite high	Google	10.0	8.1	$0.584	1/1	4.05s
Total teste 1 Teste greșite 0 Cost total $0.584 Timp de răspuns (mediu) 4.05s
#67	Claude Sonnet 4.6 none	Anthropic	10.0	7.3	$0.661	1/1	4.11s
Total teste 1 Teste greșite 0 Cost total $0.661 Timp de răspuns (mediu) 4.11s
#33	Step 3.7 Flash medium	Stepfun	10.0	8.0	$0.515	1/1	4.16s
Total teste 1 Teste greșite 0 Cost total $0.515 Timp de răspuns (mediu) 4.16s
#18	Claude Opus 4.7 medium	Anthropic	10.0	8.7	$1.477	1/1	4.17s
Total teste 1 Teste greșite 0 Cost total $1.477 Timp de răspuns (mediu) 4.17s
#210	Qwen3.5-9B medium	Qwen	10.0	3.8	$0.036	1/1	4.31s
Total teste 1 Teste greșite 0 Cost total $0.036 Timp de răspuns (mediu) 4.31s
#153	Mimo V2 PRO none	Xiaomi	10.0	5.6	$0.045	1/1	4.39s
Total teste 1 Teste greșite 0 Cost total $0.045 Timp de răspuns (mediu) 4.39s

Clasament Apelare instrumente

Filtrează modelele

Top modele după Scor Apelare instrumente

Scor Apelare instrumente vs cost total

Top modele după Timp de răspuns (mediu)