AI BENCHY
Advertise here

Сбои по категориям AI BENCHY

Следование инструкциям: Лишнее форматирование

Следование инструкциям
Лишнее форматирование

Посмотрите, какие AI-модели чаще всего сталкиваются с Лишнее форматирование в Следование инструкциям, чтобы быстрее находить слабые места. Сортировать по: Общая стоимость ↓.

Показано моделей

2

Всего сбоев

2

Наиболее затронутая модель

DeepSeek V4 Flash 1
2/2
Ранг Модель Компания Количество Лишнее форматирование Оценка категории Общая стоимость Тестов верно Время ответа (среднее)

Лучшие модели по Количество Лишнее форматирование

Количество Лишнее форматирование против Оценка

Лучшие модели по Время ответа (среднее)

Лучшие модели по Оценочная стоимость потерь