AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs MiniMax: MiniMax M2.7

Сводка

Средний балл практически равен: 5.0 vs 5.0. DeepSeek V3.2 имеет более низкую стоимость benchmark: $0.054 vs $0.196. DeepSeek V3.2 быстрее: 18.25s vs 41.28s, с долей успешных попыток 37.9% vs 45.5%.

Рекомендуемая модельDeepSeek V3.2Здесь у него лучший балл (5.0), при этом он примерно в 3.7 раза дешевле, чем MiniMax M2.7 (medium).

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-17

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	MiniMax M2.7 MiniMax M2.7 medium Релиз: 2026-03-18

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	MiniMax M2.7 MiniMax M2.7 medium Релиз: 2026-03-18
Оценка	5.0	5.0
Ранг	#165	#164
Надежность	10.0	10.0
Стабильность	7.7	6.6
Тестов верно
Доля успешных попыток	37.9%	45.5%
Нестабильные тесты	6	9
Всего запусков	66	66
Стоимость за результат	0.870	3.906
Общая стоимость	$0.054	$0.196
Цена входа	$0.269 / 1M	$0.300 / 1M
Цена выхода	$0.400 / 1M	$1.200 / 1M
Общее число входных токенов	135,780	114,518
Выходные токены	42,097	18,558
Токены рассуждений	0	119,036
Время ответа (среднее)	18.25s	41.28s
Время ответа (макс.)	115.89s	196.21s
Время ответа (суммарно)	401.60s	866.81s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#165 DeepSeek V3.2

none

Стоимость: $0.002
Время: 7.0s
Токены: 1,046 tok

#164 MiniMax M2.7

medium

Стоимость: $0.022
Время: 22.8s
Токены: 9,250 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.2	8.0	8.3%	1		9.35s	494	1,073	0
MiniMax M2.7	7.9	6.3	83.3%	2		40.32s	654	3,010	17,716

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.1	6.9	11.1%	1		14.54s	7,279	4,528	0
MiniMax M2.7	5.7	9.1	33.3%	0		101.89s	2,961	1,231	38,841

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	4.8	10.0	0.0%	0		113.53s	109,626	33,819	0
MiniMax M2.7	3.8	1.6	50.0%	2		72.12s	94,380	9,946	33,704

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	7,890	1,710	0
MiniMax M2.7	6.3	5.8	66.7%	1		21.95s	7,152	187	5,882

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	2.9	7.2	11.1%	1		4.17s	624	21	0
MiniMax M2.7	3.0	10.0	0.0%	0		19.00s	245	8	2,796

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	4.7	1.6	66.7%	1		9.32s	314	43	0
MiniMax M2.7	3.9	2.5	33.3%	1		38.70s	486	92	5,204

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	627	66	0
MiniMax M2.7	3.8	5.8	33.3%	1		12.80s	687	350	2,600

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.6	7.2	77.8%	1		6.91s	424	298	0
MiniMax M2.7	5.9	7.2	55.6%	1		24.87s	675	362	7,840

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	8,319	522	0
MiniMax M2.7	4.7	1.6	66.7%	1		12.05s	7,067	304	1,001

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	183	17	0
MiniMax M2.7	3.0	10.0	0.0%	0		22.77s	211	3,068	3,452

Быстрое сравнение

Сменить пару сравнения