AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs DeepSeek: DeepSeek V4 Pro

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-25

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	DeepSeek V4 Pro DeepSeek V4 Pro none Релиз: 2026-04-24

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	DeepSeek V4 Pro DeepSeek V4 Pro none Релиз: 2026-04-24
Оценка	6.0	6.7
Ранг	#74	#61
Надежность	Н/Д	0.0
Стабильность	8.6	9.5
Тестов верно
Доля успешных попыток	46.3%	51.9%
Нестабильные тесты	3	1
Всего запусков	52	26
Стоимость за результат	0.225	0.327
Общая стоимость	$0.016	$0.030
???? ?????	$0.252 / 1M	$1.740 / 1M
???? ??????	$0.378 / 1M	$3.480 / 1M
Выходные токены	8,378	1,611
Токены рассуждений	0	0
Время ответа (среднее)	12.07s	23.34s
Время ответа (макс.)	115.89s	109.46s
Время ответа (суммарно)	217.28s	420.04s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.2	9.8	0.0%	0		7.63s	1,419	0
DeepSeek V4 Pro	4.8	10.0	25.0%	0		36.12s	221	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	2.4	1.3	33.3%	1		7.63s	553	0
DeepSeek V4 Pro	10.0	10.0	100.0%	0		33.40s	246	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
DeepSeek V4 Pro	9.5	10.0	100.0%	0		34.55s	826	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
DeepSeek V4 Pro	10.0	10.0	100.0%	0		54.04s	65	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		1.52s	18	0
DeepSeek V4 Pro	5.3	10.0	33.3%	0		3.08s	12	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		2.86s	67	0
DeepSeek V4 Pro	4.5	10.0	0.0%	0		6.06s	45	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
DeepSeek V4 Pro	6.5	10.0	50.0%	0		9.47s	25	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	8.5	7.5	88.9%	1		7.37s	1,136	0
DeepSeek V4 Pro	6.0	7.1	44.4%	1		19.60s	98	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
DeepSeek V4 Pro	10.0	10.0	100.0%	0		6.47s	73	0

Быстрое сравнение

Сменить пару сравнения

DeepSeek V4 PrononevsGrok 4.1 Fastmedium DeepSeek V4 PrononevsNemotron 3 SupermediumБесплатно доступно DeepSeek V3.2nonevsgpt-oss-120bmediumБесплатно доступно DeepSeek V4 PrononevsMercury 2medium DeepSeek V3.2nonevsGPT-5 Nanomedium DeepSeek V4 PrononevsGrok 4.20medium DeepSeek V3.2nonevsMiniMax M2.5mediumБесплатно доступно DeepSeek V4 PrononevsKimi K2.5medium DeepSeek V4 PrononevsGPT-5 Minimedium DeepSeek V3.2nonevsMistral Small 4medium DeepSeek V4 PrononevsGPT-5 Nanomedium DeepSeek V3.2nonevsMercury 2medium