Сбои по категориям AI BENCHY
Следование инструкциям: Тайм-аут
Следование инструкциям
Тайм-аут
Посмотрите, какие AI-модели чаще всего сталкиваются с Тайм-аут в Следование инструкциям, чтобы быстрее находить слабые места. Сортировать по: Время ответа (среднее) ↓.
Причины сбоев
| Ранг | Модель | Компания | Количество Тайм-аут | Оценка категории | Тестов верно | Время ответа (среднее) |
|---|---|---|---|---|---|---|
| #97 | Qwen3.5-9B medium | Qwen | 1 | 6.4 | 1/2 | 17.1s |