Сбои по категориям AI BENCHY
Следование инструкциям: Ошибка API
Следование инструкциям
Ошибка API
Посмотрите, какие AI-модели чаще всего сталкиваются с Ошибка API в Следование инструкциям, чтобы быстрее находить слабые места. Сортировать по: Тестов верно ↑.
Причины сбоев
| Ранг | Модель | Компания | Количество Ошибка API | Оценка категории | Тестов верно | Время ответа (среднее) |
|---|---|---|---|---|---|---|
| #47 | Grok 4.20 medium | X AI | 1 | 7.3 | 1/2 | 4.42s |