Сбои по категориям AI BENCHY
Следование инструкциям: Лишнее форматирование
Следование инструкциям
Лишнее форматирование
Посмотрите, какие AI-модели чаще всего сталкиваются с Лишнее форматирование в Следование инструкциям, чтобы быстрее находить слабые места.
Причины сбоев
2/2
Фильтровать модели
Нет моделей, соответствующих текущему поиску и фильтрам.
| Ранг | Модель | Компания | Количество Лишнее форматирование | Оценка категории | Общая стоимость | Тестов верно | Время ответа (среднее) |
|---|---|---|---|---|---|---|---|
| #117 | DeepSeek V4 Flash none | DeepSeek | 1 | 6.5 | $0.007 | 1/2 | 17.5s |
| #158 | Hy3 preview none | Tencent | 1 | 6.3 | $0.003 | 1/2 | 13.0s |