AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs DeepSeek: DeepSeek V3.2

Сводка

Средний балл практически равен: 7.4 vs 7.5. Seed-2.0-Mini (medium) имеет более низкую стоимость benchmark: $0.044 vs $0.052. DeepSeek V3.2 (medium) быстрее: 68.71s vs 80.22s, с долей успешных попыток 57.1% vs 65.1%.

Рекомендуемая модельDeepSeek V3.2 (medium)У него самый высокий балл в этом сравнении (7.5) и лучший общий баланс стоимости и времени ответа среди всех 2 моделей.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-16

Метрика	Seed-2.0-Mini Seed-2.0-Mini medium Релиз: 2026-02-14	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01

Метрика	Seed-2.0-Mini Seed-2.0-Mini medium Релиз: 2026-02-14	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01
Оценка	7.4	7.5
Ранг	#70	#68
Надежность	6.7	10.0
Стабильность	9.3	7.6
Тестов верно
Доля успешных попыток	57.1%	65.1%
Нестабильные тесты	2	6
Всего запусков	63	63
Стоимость за результат	0.397	0.436
Общая стоимость	$0.044	$0.052
Цена входа	$0.100 / 1M	$0.269 / 1M
Цена выхода	$0.400 / 1M	$0.400 / 1M
Общее число входных токенов	41,904	38,333
Выходные токены	2,555	7,186
Токены рассуждений	95,974	99,081
Время ответа (среднее)	80.22s	68.71s
Время ответа (макс.)	262.83s	376.10s
Время ответа (суммарно)	1363.72s	1442.81s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#70 Seed-2.0-Mini

medium

Стоимость: $0.002
Время: 161.7s
Токены: 4,379 tok

#68 DeepSeek V3.2

medium

Стоимость: $0.001
Время: 53.6s
Токены: 1,932 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Mini	6.6	10.0	50.0%	0		74.75s	791	360	9,520
DeepSeek V3.2	8.2	7.9	83.3%	1		24.23s	448	3,247	6,953

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Mini	5.5	9.8	33.3%	0		220.48s	3,823	464	34,964
DeepSeek V3.2	6.0	7.2	55.6%	1		248.68s	5,717	649	52,014

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Mini	10.0	10.0	100.0%	0		262.83s	16,533	404	29,806
DeepSeek V3.2	10.0	10.0	100.0%	0		93.11s	14,283	571	6,296

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Mini	10.0	10.0	100.0%	0		24.27s	8,568	246	2,743
DeepSeek V3.2	10.0	10.0	100.0%	0		36.09s	7,388	207	7,693

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Mini	3.0	10.0	0.0%	0		0ms	0	0	0
DeepSeek V3.2	2.9	4.4	22.2%	2		24.27s	472	21	6,838

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Mini	5.1	3.4	33.3%	1		36.65s	585	213	4,210
DeepSeek V3.2	3.4	2.5	33.3%	1		58.29s	314	49	2,189

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Mini	10.0	10.0	100.0%	0		17.47s	840	69	2,050
DeepSeek V3.2	10.0	10.0	100.0%	0		35.78s	627	1,397	2,845

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Mini	8.2	7.2	88.9%	1		31.79s	903	527	5,667
DeepSeek V3.2	7.0	7.2	55.6%	1		37.69s	594	518	6,375

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Mini	10.0	10.0	100.0%	0		88.68s	9,585	222	5,235
DeepSeek V3.2	10.0	10.0	100.0%	0		34.81s	8,307	507	859

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Mini	3.0	10.0	0.0%	0		56.76s	276	50	1,779
DeepSeek V3.2	3.0	10.0	0.0%	0		83.99s	183	20	7,019

Быстрое сравнение

Сменить пару сравнения

Seed-2.0-MinimediumvsGemini 3 Flash Previewlow DeepSeek V3.2mediumvsGPT-5.3 Chatnone DeepSeek V3.2mediumvsGemini 3 Flash Previewlow Seed-2.0-MinimediumvsGPT-5.3 Chatnone Claude Sonnet 4.6nonevsSeed-2.0-Minimedium Claude Sonnet 4.6nonevsDeepSeek V3.2medium Claude Opus 4.8nonevsSeed-2.0-Minimedium Seed-2.0-MinimediumvsDeepSeek V4 Prohigh DeepSeek V3.2mediumvsKAT-Coder-Pro V2.5high Claude Opus 4.8nonevsDeepSeek V3.2medium DeepSeek V3.2mediumvsGPT-5.6 Lunahigh DeepSeek V3.2mediumvsStep 3.7 Flashlow