AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs DeepSeek: DeepSeek V4 Pro

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-25

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	DeepSeek V4 Pro DeepSeek V4 Pro none Релиз: 2026-04-24

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	DeepSeek V4 Pro DeepSeek V4 Pro none Релиз: 2026-04-24
Оценка	6.2	6.7
Ранг	#71	#61
Надежность	Н/Д	0.0
Стабильность	7.7	9.5
Тестов верно
Доля успешных попыток	55.6%	51.9%
Нестабильные тесты	5	1
Всего запусков	54	26
Стоимость за результат	0.200	0.327
Общая стоимость	$0.016	$0.030
???? ?????	$0.250 / 1M	$1.740 / 1M
???? ??????	$2.000 / 1M	$3.480 / 1M
Выходные токены	3,129	1,611
Токены рассуждений	0	0
Время ответа (среднее)	2.53s	23.34s
Время ответа (макс.)	6.70s	109.46s
Время ответа (суммарно)	45.46s	420.04s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
DeepSeek V4 Pro	4.8	10.0	25.0%	0		36.12s	221	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		4.61s	380	0
DeepSeek V4 Pro	10.0	10.0	100.0%	0		33.40s	246	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
DeepSeek V4 Pro	9.5	10.0	100.0%	0		34.55s	826	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
DeepSeek V4 Pro	10.0	10.0	100.0%	0		54.04s	65	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
DeepSeek V4 Pro	5.3	10.0	33.3%	0		3.08s	12	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
DeepSeek V4 Pro	4.5	10.0	0.0%	0		6.06s	45	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
DeepSeek V4 Pro	6.5	10.0	50.0%	0		9.47s	25	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.2	4.4	55.6%	2		2.46s	620	0
DeepSeek V4 Pro	6.0	7.1	44.4%	1		19.60s	98	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
DeepSeek V4 Pro	10.0	10.0	100.0%	0		6.47s	73	0

Быстрое сравнение

Сменить пару сравнения

DeepSeek V4 PrononevsGrok 4.1 Fastmedium DeepSeek V4 PrononevsNemotron 3 SupermediumБесплатно доступно Seed-2.0-LitenonevsGPT-5 Nanomedium DeepSeek V4 PrononevsMercury 2medium DeepSeek V4 PrononevsGrok 4.20medium Seed-2.0-Litenonevsgpt-oss-120bmediumБесплатно доступно Seed-2.0-LitenonevsMercury 2medium DeepSeek V4 PrononevsKimi K2.5medium DeepSeek V4 PrononevsGPT-5 Minimedium DeepSeek V4 PrononevsGPT-5 Nanomedium Seed-2.0-LitenonevsMiniMax M2.5mediumБесплатно доступно Seed-2.0-LitenonevsGrok 4.1 Fastmedium