DeepSeek: DeepSeek V3.2 vs Xiaomi: MiMo-V2.5-Pro

MiMo-V2.5-Pro лидирует по среднему баллу: 5.5 vs 5.0. DeepSeek V3.2 имеет более низкую стоимость benchmark: $0.054 vs $0.068. MiMo-V2.5-Pro быстрее: 4.12s vs 18.25s, с долей успешных попыток 37.9% vs 37.9%.

Рекомендуемая модельMiMo-V2.5-ProЗдесь у него лучший балл (5.5), и он отвечает примерно в 4.4 раза быстрее, чем DeepSeek V3.2.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-17

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	MiMo-V2.5-Pro MiMo-V2.5-Pro none Релиз: 2026-04-22

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	MiMo-V2.5-Pro MiMo-V2.5-Pro none Релиз: 2026-04-22
Оценка	5.0	5.5
Ранг	#165	#147
Надежность	10.0	10.0
Стабильность	7.7	8.6
Тестов верно
Доля успешных попыток	37.9%	37.9%
Нестабильные тесты	6	4
Всего запусков	66	66
Стоимость за результат	0.870	1.509
Общая стоимость	$0.054	$0.068
Цена входа	$0.269 / 1M	$0.435 / 1M
Цена выхода	$0.400 / 1M	$0.870 / 1M
Общее число входных токенов	135,780	124,799
Выходные токены	42,097	15,362
Токены рассуждений	0	0
Время ответа (среднее)	18.25s	4.12s
Время ответа (макс.)	115.89s	53.13s
Время ответа (суммарно)	401.60s	90.55s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#165 DeepSeek V3.2

none

Стоимость: $0.002
Время: 7.0s
Токены: 1,046 tok

#147 MiMo-V2.5-Pro

none

Стоимость: $0.004
Время: 46.4s
Токены: 4,025 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.2	8.0	8.3%	1		9.35s	494	1,073	0
MiMo-V2.5-Pro	3.3	8.1	8.3%	1		2.67s	645	994	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.1	6.9	11.1%	1		14.54s	7,279	4,528	0
MiMo-V2.5-Pro	4.3	7.8	22.2%	1		1.41s	6,559	485	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	4.8	10.0	0.0%	0		113.53s	109,626	33,819	0
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		28.33s	98,770	12,915	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	7,890	1,710	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		1.32s	7,758	249	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	2.9	7.2	11.1%	1		4.17s	624	21	0
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		877ms	753	27	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	4.7	1.6	66.7%	1		9.32s	314	43	0
MiMo-V2.5-Pro	4.0	10.0	0.0%	0		2.58s	498	87	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	627	66	0
MiMo-V2.5-Pro	6.4	10.0	50.0%	0		1.03s	684	66	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.6	7.2	77.8%	1		6.91s	424	298	0
MiMo-V2.5-Pro	6.7	4.7	77.8%	2		1.30s	678	267	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	8,319	522	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.30s	8,238	258	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	183	17	0
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		1.89s	216	14	0

Быстрое сравнение

Сменить пару сравнения

DeepSeek V3.2nonevsMiniMax M2.7medium KAT-Coder-Air V2.5mediumvsMiMo-V2.5-Pronone KAT-Coder-Air V2.5lowvsMiMo-V2.5-Pronone DeepSeek V3.2nonevsMistral Small 4medium KAT-Coder-Air V2.5highvsMiMo-V2.5-Pronone Nemotron 3 SupermediumБесплатно доступноvsMiMo-V2.5-Pronone DeepSeek V3.2nonevsQwen3 Coder Nextmedium CobuddymediumvsDeepSeek V3.2none North Mini CodemediumБесплатно доступноvsMiMo-V2.5-Pronone Mistral Small 4mediumvsMiMo-V2.5-Pronone DeepSeek V3.2nonevsKAT-Coder-Air V2.5low DeepSeek V3.2nonevsMiniMax M2.5medium