AI BENCHY
Your ad here

Категория AI BENCHY

Рейтинг Следование инструкциям

Посмотрите, какие AI-модели лучше всего справляются с Следование инструкциям, какие остаются надежными и где заметнее всего разница. Сортировать по: Тестов верно ↑.

Показано моделей

15

Среднее значение Оценка Следование инструкциям

8.0

Лучшая модель

Gemma 4 26B A4B 4.4
Ранг Модель Компания Оценка Следование инструкциям Оценка Тестов верно Время ответа (среднее)
#56 Grok 4.20 Multi Agent Beta medium X AI 8.3 6.4 1/2 4.63s
#57 GPT-5 Nano medium OpenAI 8.5 6.3 1/2 11.9s
#58 GLM 5V Turbo none Z.ai 6.5 6.2 1/2 1.97s
#59 Qwen3.5-Flash none Qwen 6.3 6.2 1/2 8.81s
#62 Gemini 2.5 Flash none Google 8.0 6.2 1/2 672ms
#63 Qwen3.5-35B-A3B none Qwen 6.3 6.1 1/2 809ms
#65 MiMo-V2-Pro none Xiaomi 6.5 6.0 1/2 2.51s
#66 GPT-5.4 none OpenAI 6.5 5.9 1/2 1.07s
#69 Kimi K2.6 none Moonshot AI 6.5 5.8 1/2 1.64s
#71 MiniMax M2.5 medium Minimax 8.1 5.7 1/2 4.64s
#72 Hunter Alpha none OpenRouter 6.4 5.7 1/2 2.82s
#73 Mistral Small 4 medium Mistral 7.3 5.7 1/2 1.38s
#74 GLM 4.7 Flash none Z.ai 6.5 5.6 1/2 888ms
#75 GLM 5.1 none Z.ai 8.3 5.6 1/2 1.58s
#76 Kimi K2.5 none Moonshot AI 6.5 5.5 1/2 2.67s

Лучшие модели по Оценка Следование инструкциям

Оценка Следование инструкциям vs общая стоимость

Лучшие модели по Время ответа (среднее)