AI BENCHY
Сравнить Графики
❤️ Made by XCS
Your ad here

#18

Seed-2.0-Mini

Bytedance Seed · bytedance-seed/seed-2.0-mini::medium

Средний балл

6.13

Стоимость за результат

0.177

Стабильность

8.91

Общая стоимость

$0.013

Тестов верно

7

Тест считается полностью пройденным, только если все его прогоны успешны.

Ошибочных тестов

7

Доля успешных попыток: 59.5%

Нестабильные тесты

2

Время ответа: среднее 51.69s · суммарно 568.63s · макс. 182.10s

Тайм-аут: 4 Не соблюдены инструкции: 2 Неверный ответ: 1

Лучшие модели по оценке

Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.

Быстрое сравнение

Разбивка по категориям

Категория Средний балл Стабильность Тестов верно
Anti-AI Tricks 7.00 10.00 2/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 1.00 10.00 0/3
Instructions following 8.00 9.99 1/2
Puzzle Solving 5.34 4.91 1/3
Tool Calling 10.00 10.00 1/1