Рейтинг моделей по Вызов инструментов

Посмотрите, какие AI-модели лучше всего справляются с Вызов инструментов, какие остаются надежными и где заметнее всего разница. Сортировать по: Время ответа (среднее) ↓.

Показано моделей

Среднее значение Оценка Вызов инструментов

8.8

Лучшая модель

Ring-2.6-1T 10.0

Причины сбоев

С причиной сбоя Ошибка API17 С причиной сбоя Недопустимый вызов инструмента9 С причиной сбоя Не соблюдены инструкции8 С причиной сбоя Неверный ответ3 С причиной сбоя Нет ответа2

216/216

Ранг	Модель	Компания	Оценка Вызов инструментов	Оценка	Общая стоимость	Тестов верно	Время ответа (среднее)
#200	GLM 4.7 Flash medium	Z.ai	10.0	4.3	$0.166	1/1	15.9s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.166 Время ответа (среднее) 15.9s
#46	GLM 5 medium	Z.ai	10.0	7.7	$0.307	1/1	15.9s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.307 Время ответа (среднее) 15.9s
#50	DeepSeek V4 Pro high	DeepSeek	9.8	7.7	$0.200	1/1	15.9s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.200 Время ответа (среднее) 15.9s
#101	GLM 5.2 none	Z.ai	10.0	6.6	$0.128	1/1	15.8s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.128 Время ответа (среднее) 15.8s
#196	MiniMax M2.5 medium	Minimax	10.0	4.6	$0.340	1/1	15.4s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.340 Время ответа (среднее) 15.4s
#106	Hy3 preview medium	Tencent	10.0	6.5	$0.018	1/1	15.0s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.018 Время ответа (среднее) 15.0s
#40	Qwen3.7 Plus medium	Qwen	10.0	7.9	$0.267	1/1	15.0s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.267 Время ответа (среднее) 15.0s
#74	Qwen3.5 Plus 2026-04-20 medium	Qwen	10.0	7.2	$0.317	1/1	14.7s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.317 Время ответа (среднее) 14.7s
#161	Kimi K2.5 none	Moonshot AI	10.0	5.5	$0.127	1/1	14.0s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.127 Время ответа (среднее) 14.0s
#140	Mimo V2 Omni medium	Xiaomi	10.0	5.9	$0.683	1/1	14.0s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.683 Время ответа (среднее) 14.0s
#79	Grok 4.20 medium	X AI	3.0	7.1	$0.777	0/1	13.7s
Всего тестов 1 Ошибочных тестов 1 Общая стоимость $0.777 Время ответа (среднее) 13.7s
#21	GPT-5.4 medium	OpenAI	10.0	8.5	$1.533	1/1	13.3s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $1.533 Время ответа (среднее) 13.3s
#52	Grok Build 0.1 medium	X AI	10.0	7.6	$1.097	1/1	13.1s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $1.097 Время ответа (среднее) 13.1s
#3	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	1/1	12.6s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.742 Время ответа (среднее) 12.6s
#98	GLM 5V Turbo medium	Z.ai	7.0	6.7	$0.457	0/1	12.5s
Всего тестов 1 Ошибочных тестов 1 Общая стоимость $0.457 Время ответа (среднее) 12.5s

Рейтинг Вызов инструментов

Фильтровать модели

Лучшие модели по Оценка Вызов инструментов

Оценка Вызов инструментов vs общая стоимость

Лучшие модели по Время ответа (среднее)