AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Xiaomi: MiMo-V2.5-Pro

Сводка

Сравнение benchmark DeepSeek V3.2 vs MiMo-V2.5-Pro: Средний балл практически равен: 7.5 vs 7.4. DeepSeek V3.2 имеет более низкую стоимость benchmark: $0.044 vs $0.106. MiMo-V2.5-Pro быстрее: 26.13s vs 68.71s, с долей успешных попыток 65.1% vs 68.3%.

Рекомендуемая модель: DeepSeek V3.2 - Здесь у него лучший балл (7.5), при этом он примерно в 2.4 раза дешевле, чем MiMo-V2.5-Pro.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-12

Метрика	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Релиз: 2026-04-22

Метрика	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Релиз: 2026-04-22
Оценка	7.5	7.4
Ранг	#50	#52
Надежность	10.0	10.0
Стабильность	7.6	8.5
Тестов верно
Доля успешных попыток	65.1%	68.3%
Нестабильные тесты	6	4
Всего запусков	63	63
Стоимость за результат	0.436	2.541
Общая стоимость	$0.044	$0.106
Цена входа	$0.229 / 1M	$0.435 / 1M
Цена выхода	$0.344 / 1M	$0.870 / 1M
Общее число входных токенов	38,333	40,854
Выходные токены	7,186	5,015
Токены рассуждений	99,081	97,742
Время ответа (среднее)	68.71s	26.13s
Время ответа (макс.)	376.10s	130.77s
Время ответа (суммарно)	1442.81s	548.65s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#50 DeepSeek V3.2

medium

Cost: $0.001
Time: 53.6s
Tokens: 1,932 tok

#52 MiMo-V2.5-Pro

medium

Invalid SVG

Cost: $0.000
Time: 300.0s
Tokens: 0 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	8.2	7.9	83.3%	1		24.23s	448	3,247	6,953
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.26s	621	323	1,179

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.0	7.2	55.6%	1		248.68s	5,717	649	52,014
MiMo-V2.5-Pro	6.2	4.7	66.7%	2		92.07s	6,543	780	51,218

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		93.11s	14,283	571	6,296
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		53.36s	15,060	348	11,870

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		36.09s	7,388	207	7,693
MiMo-V2.5-Pro	7.3	5.8	83.3%	1		18.81s	7,746	260	8,383

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	2.9	4.4	22.2%	2		24.27s	472	21	6,838
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		37.87s	630	275	17,023

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.4	2.5	33.3%	1		58.29s	314	49	2,189
MiMo-V2.5-Pro	5.5	10.0	0.0%	0		4.02s	492	155	163

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		35.78s	627	1,397	2,845
MiMo-V2.5-Pro	9.9	10.0	100.0%	0		2.77s	672	82	803

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.0	7.2	55.6%	1		37.69s	594	518	6,375
MiMo-V2.5-Pro	6.7	7.9	55.6%	1		5.31s	660	540	2,181

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		34.81s	8,307	507	859
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		16.87s	8,220	311	2,908

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		83.99s	183	20	7,019
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		12.46s	210	1,941	2,014

Быстрое сравнение

Сменить пару сравнения

Gemini 3 Flash PreviewlowvsMiMo-V2.5-Promedium DeepSeek V3.2mediumvsGPT-5.3 Chatnone DeepSeek V3.2mediumvsGemini 3 Flash Previewlow GPT-5.3 ChatnonevsMiMo-V2.5-Promedium Claude Sonnet 4.6nonevsMiMo-V2.5-Promedium Claude Sonnet 4.6nonevsDeepSeek V3.2medium Claude Opus 4.8nonevsMiMo-V2.5-Promedium Claude Opus 4.8nonevsDeepSeek V3.2medium DeepSeek V3.2mediumvsStep 3.7 Flashlow Qwen3.7 PlusnonevsMiMo-V2.5-Promedium Step 3.7 FlashlowvsMiMo-V2.5-Promedium DeepSeek V3.2mediumvsQwen3.7 Plusnone