AI BENCHY
Your ad here

Сбои по категориям AI BENCHY

Следование инструкциям: Лишнее форматирование

Следование инструкциям
Лишнее форматирование

Посмотрите, какие AI-модели чаще всего сталкиваются с Лишнее форматирование в Следование инструкциям, чтобы быстрее находить слабые места. Сортировать по: Время ответа (среднее) ↓.

Показано моделей

2

Всего сбоев

2

Наиболее затронутая модель

DeepSeek V4 Flash 1

Лучшие модели по Количество Лишнее форматирование

Количество Лишнее форматирование против Оценка

Лучшие модели по Время ответа (среднее)

Лучшие модели по Оценочная стоимость потерь