AI BENCHY
Advertise here

Категория AI BENCHY

Рейтинг Вызов инструментов

Посмотрите, какие AI-модели лучше всего справляются с Вызов инструментов, какие остаются надежными и где заметнее всего разница. Сортировать по: Тестов верно ↓.

Показано моделей

15

Среднее значение Оценка Вызов инструментов

8.7

Лучшая модель

Gemini 3 Flash Preview 10.0
Ранг Модель Компания Оценка Вызов инструментов Оценка Тестов верно Время ответа (среднее)
#108 Qwen3.5-Flash none Qwen 10.0 5.8 1/1 3.67s
#109 GLM 5V Turbo none Z.ai 10.0 5.8 1/1 4.86s
#110 Seed-2.0-Lite none Bytedance Seed 10.0 5.8 1/1 3.94s
#111 Owl Alpha medium Openrouter 10.0 5.7 1/1 8.26s
#112 GLM 5.1 none Z.ai 10.0 5.7 1/1 10.7s
#113 DeepSeek V4 Pro none DeepSeek 10.0 5.7 1/1 5.92s
#114 Qwen3.5 Plus 2026-04-20 none Qwen 10.0 5.7 1/1 4.42s
#115 Qwen3.5-27B none Qwen 10.0 5.7 1/1 3.54s
#116 Hunter Alpha none OpenRouter 10.0 5.7 1/1 6.02s
#117 Qwen3.5-35B-A3B none Qwen 10.0 5.6 1/1 2.30s
#118 Qwen3.6 27B none Qwen 9.5 5.6 1/1 6.74s
#119 Cobuddy medium Baidu 10.0 5.6 1/1 11.2s
#120 Mimo V2 PRO none Xiaomi 10.0 5.6 1/1 4.39s
#121 Owl Alpha none Openrouter 10.0 5.5 1/1 22.8s
#123 MiMo-V2.5-Pro none Xiaomi 10.0 5.5 1/1 3.30s

Лучшие модели по Оценка Вызов инструментов

Оценка Вызов инструментов vs общая стоимость

Лучшие модели по Время ответа (среднее)