Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs DeepSeek: DeepSeek V4 Pro

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-26

Метрика Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14 DeepSeek V4 Pro DeepSeek V4 Pro high Релиз: 2026-04-24
Оценка 6.2 6.8
Ранг #72 #57
Надежность Н/Д 8.4
Стабильность 7.7 8.0
Тестов верно
Доля успешных попыток 55.6% 73.2%
Нестабильные тесты 5 4
Всего запусков 54 54
Стоимость за результат 0.200 1.825
Общая стоимость $0.016 $0.201
???? ????? $0.250 / 1M $1.740 / 1M
???? ?????? $2.000 / 1M $3.480 / 1M
Выходные токены 3,129 11,876
Токены рассуждений 0 45,999
Время ответа (среднее) 2.53s 60.02s
Время ответа (макс.) 6.70s 358.35s
Время ответа (суммарно) 45.46s 1080.31s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 709 0
DeepSeek V4 Pro 7.4 10.0 75.0% 0 16.53s 71 3,617
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 4.61s 380 0
DeepSeek V4 Pro 2.6 0.0 50.0% 1 51.77s 105 2,641
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 498 0
DeepSeek V4 Pro 6.6 10.0 100.0% 0 64.72s 183 1,946
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 246 0
DeepSeek V4 Pro 8.8 10.0 100.0% 0 23.62s 229 1,710
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 17 0
DeepSeek V4 Pro 3.0 6.9 16.7% 1 205.66s 10,529 28,089
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
DeepSeek V4 Pro 6.1 3.1 66.7% 1 25.09s 76 1,152
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
DeepSeek V4 Pro 10.0 10.0 100.0% 0 41.16s 205 2,416
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 5.2 4.4 55.6% 2 2.46s 620 0
DeepSeek V4 Pro 6.9 7.0 83.3% 1 34.92s 106 3,835
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
DeepSeek V4 Pro 10.0 10.0 100.0% 0 21.33s 372 593

Быстрое сравнение

Сменить пару сравнения