AI BENCHY
Your ad here

Сбои AI BENCHY

Сбои: Не соблюдены инструкции

Посмотрите, какие AI-модели чаще всего сталкиваются с Не соблюдены инструкции, чтобы заранее заметить риски надежности. Сортировать по: Оценка ↓.

Показано моделей

5

Всего сбоев

180

Наиболее затронутая модель

Seed-2.0-Lite 2
Ранг Модель Компания Количество Не соблюдены инструкции Оценка Тестов верно Время ответа (среднее)
#94 MiMo-V2-Flash none Xiaomi 1 4.5 3/18 2.79s
#95 Grok 4.1 Fast none X AI 2 4.5 3/18 1.76s
#96 GPT-5.4 Nano none OpenAI 3 4.5 2/18 1.40s
#97 Qwen3.5-9B medium Qwen 2 4.4 3/18 73.6s
#98 LFM2-24B-A2B none Liquid 2 4.1 1/16 811ms

Лучшие модели по Количество Не соблюдены инструкции

Количество Не соблюдены инструкции против Оценка

Лучшие модели по Время ответа (среднее)