AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs DeepSeek: DeepSeek V3.2

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-01

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01
Оценка	5.9	5.6
Ранг	#106	#120
Надежность	10.0	10.0
Стабильность	8.3	8.3
Тестов верно
Доля успешных попыток	48.3%	41.7%
Нестабильные тесты	4	6
Всего запусков	60	60
Стоимость за результат	0.218	0.222
Общая стоимость	$0.018	$0.018
Цена входа	$0.250 / 1M	$0.252 / 1M
Цена выхода	$2.000 / 1M	$0.378 / 1M
Выходные токены	3,253	11,159
Токены рассуждений	0	0
Время ответа (среднее)	2.48s	14.43s
Время ответа (макс.)	6.70s	115.89s
Время ответа (суммарно)	49.67s	288.55s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
DeepSeek V3.2	3.2	8.2	8.3%	1		9.35s	1,073	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	6.8	9.9	50.0%	0		2.95s	404	0
DeepSeek V3.2	3.1	5.4	16.7%	1		20.87s	4,522	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
DeepSeek V3.2	2.9	6.9	11.1%	1		4.17s	21	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
DeepSeek V3.2	6.8	10.0	66.7%	1		9.32s	43	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.3	7.2	44.4%	1		2.78s	709	0
DeepSeek V3.2	8.3	10.0	77.8%	1		6.91s	298	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	11	0
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	17	0

Быстрое сравнение

Сменить пару сравнения

Seed-2.0-LitenonevsOwl Alphamedium Seed-2.0-Litenonevsgpt-oss-120bmediumБесплатно доступно Seed-2.0-LitenonevsNemotron 3 SupermediumБесплатно доступно DeepSeek V3.2nonevsMiniMax M2.5medium CobuddymediumvsSeed-2.0-Litenone DeepSeek V3.2nonevsMistral Small 4medium CobuddymediumvsDeepSeek V3.2none DeepSeek V3.2nonevsElephant Alphamedium DeepSeek V3.2nonevsMiniMax M2.7medium Seed-2.0-LitenonevsGPT-5 Nanomedium DeepSeek V3.2nonevsOwl Alphamedium DeepSeek V3.2nonevsgpt-oss-120bmediumБесплатно доступно