Рейтинг моделей по Вызов инструментов

Посмотрите, какие AI-модели лучше всего справляются с Вызов инструментов, какие остаются надежными и где заметнее всего разница. Сортировать по: Время ответа (среднее) ↓.

Показано моделей

Среднее значение Оценка Вызов инструментов

8.7

Лучшая модель

Ring-2.6-1T 10.0

Причины сбоев

С причиной сбоя Ошибка API17 С причиной сбоя Недопустимый вызов инструмента9 С причиной сбоя Не соблюдены инструкции8 С причиной сбоя Неверный ответ3 С причиной сбоя Нет ответа2

210/210

Ранг	Модель	Компания	Оценка Вызов инструментов	Оценка	Общая стоимость	Тестов верно	Время ответа (среднее)
#7	Gemini 3.1 Pro Preview medium	Google	10.0	9.2	$1.361	1/1	23.1s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $1.361 Время ответа (среднее) 23.1s
#148	Owl Alpha none	Openrouter	10.0	5.6	$0.000	1/1	22.8s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.000 Время ответа (среднее) 22.8s
#38	GLM 5.2 medium	Z.ai	10.0	7.8	$0.222	1/1	20.4s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.222 Время ответа (среднее) 20.4s
#81	KAT-Coder-Pro V2.5 medium	Kwaipilot	10.0	6.9	$0.467	1/1	19.0s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.467 Время ответа (среднее) 19.0s
#178	Ling-2.6-flash none	Inclusionai	3.0	4.9	$0.002	0/1	18.8s
Всего тестов 1 Ошибочных тестов 1 Общая стоимость $0.002 Время ответа (среднее) 18.8s
#26	GPT-5 Mini medium	OpenAI	10.0	8.1	$0.237	1/1	18.6s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.237 Время ответа (среднее) 18.6s
#62	KAT-Coder-Pro V2.5 low	Kwaipilot	10.0	7.4	$0.387	1/1	18.4s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.387 Время ответа (среднее) 18.4s
#19	Qwen3.6 Max Preview medium	Qwen	10.0	8.4	$1.143	1/1	18.3s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $1.143 Время ответа (среднее) 18.3s
#153	Hy3 preview low	Tencent	2.8	5.5	$0.015	0/1	17.8s
Всего тестов 1 Ошибочных тестов 1 Общая стоимость $0.015 Время ответа (среднее) 17.8s
#73	Grok 4.3 medium	X AI	10.0	7.1	$0.779	1/1	17.7s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.779 Время ответа (среднее) 17.7s
#184	Hunter Alpha medium	OpenRouter	10.0	4.7	$0.000	1/1	17.3s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.000 Время ответа (среднее) 17.3s
#17	Claude Fable 5 medium	Anthropic	10.0	8.6	$3.478	1/1	17.0s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $3.478 Время ответа (среднее) 17.0s
#99	Qwen3.6 27B medium	Qwen	10.0	6.5	$0.779	1/1	16.9s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.779 Время ответа (среднее) 16.9s
#84	MiMo-V2.5-Pro medium	Xiaomi	10.0	6.9	$0.187	1/1	16.9s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.187 Время ответа (среднее) 16.9s
#177	Nemotron 3 Super none	NVIDIA	4.7	4.9	$0.008	0/1	16.0s
Всего тестов 1 Ошибочных тестов 1 Общая стоимость $0.008 Время ответа (среднее) 16.0s

Рейтинг Вызов инструментов

Фильтровать модели

Лучшие модели по Оценка Вызов инструментов

Оценка Вызов инструментов vs общая стоимость

Лучшие модели по Время ответа (среднее)