DeepSeek: DeepSeek V3.2 vs MoonshotAI: Kimi K2.5

Kimi K2.5 лидирует по среднему баллу: 5.5 vs 5.0. DeepSeek V3.2 имеет более низкую стоимость benchmark: $0.054 vs $0.127. DeepSeek V3.2 быстрее: 18.25s vs 19.15s, с долей успешных попыток 37.9% vs 34.9%.

Рекомендуемая модельKimi K2.5У него самый высокий балл в этом сравнении (5.5) и лучший общий баланс стоимости и времени ответа среди всех 2 моделей.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-17

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	Kimi K2.5 Kimi K2.5 none Релиз: 2026-01-27

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	Kimi K2.5 Kimi K2.5 none Релиз: 2026-01-27
Оценка	5.0	5.5
Ранг	#165	#148
Надежность	10.0	10.0
Стабильность	7.7	8.6
Тестов верно
Доля успешных попыток	37.9%	34.9%
Нестабильные тесты	6	4
Всего запусков	66	66
Стоимость за результат	0.870	1.898
Общая стоимость	$0.054	$0.127
Цена входа	$0.269 / 1M	$0.571 / 1M
Цена выхода	$0.400 / 1M	$2.850 / 1M
Общее число входных токенов	135,780	89,322
Выходные токены	42,097	26,638
Токены рассуждений	0	0
Время ответа (среднее)	18.25s	19.15s
Время ответа (макс.)	115.89s	102.83s
Время ответа (суммарно)	401.60s	287.30s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#165 DeepSeek V3.2

none

Стоимость: $0.002
Время: 7.0s
Токены: 1,046 tok

#148 MoonshotAI: Kimi K2.5

none

Стоимость: $0.015
Время: 89.1s
Токены: 5,421 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.2	8.0	8.3%	1		9.35s	494	1,073	0
Kimi K2.5	3.6	8.4	8.3%	1		6.24s	652	373	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.1	6.9	11.1%	1		14.54s	7,279	4,528	0
Kimi K2.5	5.5	10.0	33.3%	0		24.56s	7,311	4,708	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	4.8	10.0	0.0%	0		113.53s	109,626	33,819	0
Kimi K2.5	2.8	1.8	33.3%	2		61.00s	65,552	20,729	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	7,890	1,710	0
Kimi K2.5	7.3	5.8	83.3%	1		42.13s	7,180	187	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	2.9	7.2	11.1%	1		4.17s	624	21	0
Kimi K2.5	5.3	10.0	33.3%	0		4.38s	753	29	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	4.7	1.6	66.7%	1		9.32s	314	43	0
Kimi K2.5	10.0	10.0	100.0%	0		4.00s	483	76	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	627	66	0
Kimi K2.5	6.5	10.0	50.0%	0		2.67s	677	60	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.6	7.2	77.8%	1		6.91s	424	298	0
Kimi K2.5	3.0	10.0	0.0%	0		4.04s	667	236	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	8,319	522	0
Kimi K2.5	10.0	10.0	100.0%	0		13.99s	5,835	220	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	183	17	0
Kimi K2.5	3.0	10.0	0.0%	0		3.90s	212	20	0

Быстрое сравнение

Сменить пару сравнения

DeepSeek V3.2nonevsMiniMax M2.7medium KAT-Coder-Air V2.5mediumvsKimi K2.5none KAT-Coder-Air V2.5lowvsKimi K2.5none DeepSeek V3.2nonevsMistral Small 4medium KAT-Coder-Air V2.5highvsKimi K2.5none Kimi K2.5nonevsNemotron 3 SupermediumБесплатно доступно DeepSeek V3.2nonevsQwen3 Coder Nextmedium CobuddymediumvsDeepSeek V3.2none North Mini CodemediumБесплатно доступноvsKimi K2.5none Mistral Small 4mediumvsKimi K2.5none DeepSeek V3.2nonevsKAT-Coder-Air V2.5low DeepSeek V3.2nonevsMiniMax M2.5medium