AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Категория AI BENCHY

Рейтинг Вызов инструментов

Посмотрите, какие AI-модели лучше всего справляются с Вызов инструментов, какие остаются надежными и где заметнее всего разница.

Показано моделей

15

Среднее значение Оценка Вызов инструментов

8.7

Лучшая модель

Gemini 3 Flash Preview 10.0
Ранг Модель Компания Оценка Вызов инструментов Оценка Тестов верно Время ответа (среднее)
#110 Seed-2.0-Lite none Bytedance Seed 10.0 5.8 1/1 3.94s
#111 Owl Alpha medium Openrouter 10.0 5.7 1/1 8.26s
#112 GLM 5.1 none Z.ai 10.0 5.7 1/1 10.7s
#113 DeepSeek V4 Pro none DeepSeek 10.0 5.7 1/1 5.92s
#114 Qwen3.5 Plus 2026-04-20 none Qwen 10.0 5.7 1/1 4.42s
#115 Qwen3.5-27B none Qwen 10.0 5.7 1/1 3.54s
#116 Hunter Alpha none OpenRouter 10.0 5.7 1/1 6.02s
#117 Qwen3.5-35B-A3B none Qwen 10.0 5.6 1/1 2.30s
#119 Cobuddy medium Baidu 10.0 5.6 1/1 11.2s
#120 Mimo V2 PRO none Xiaomi 10.0 5.6 1/1 4.39s
#121 Owl Alpha none Openrouter 10.0 5.5 1/1 22.8s
#123 MiMo-V2.5-Pro none Xiaomi 10.0 5.5 1/1 3.30s
#124 Kimi K2.6 none Moonshot AI 10.0 5.5 1/1 4.46s
#125 GPT-5.4 none OpenAI 10.0 5.5 1/1 2.75s
#127 Grok 4.20 none X AI 10.0 5.4 1/1 4.63s

Лучшие модели по Оценка Вызов инструментов

Оценка Вызов инструментов vs общая стоимость

Лучшие модели по Время ответа (среднее)