AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs MoonshotAI: Kimi K2.6

Сводка

Kimi K2.6 лидирует по среднему баллу: 5.8 vs 5.3. DeepSeek V3.2 имеет более низкую стоимость benchmark: $0.020 vs $0.097. Kimi K2.6 быстрее: 13.27s vs 13.83s, с долей успешных попыток 39.7% vs 36.5%.

Рекомендуемая модельKimi K2.6У него самый высокий балл в этом сравнении (5.8) и лучший общий баланс стоимости и времени ответа среди всех 2 моделей.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-16

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	Kimi K2.6 Kimi K2.6 none Релиз: 2026-04-20 Бесплатно доступно

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	Kimi K2.6 Kimi K2.6 none Релиз: 2026-04-20 Бесплатно доступно
Оценка	5.3	5.8
Ранг	#157	#139
Надежность	10.0	10.0
Стабильность	7.6	9.2
Тестов верно
Доля успешных попыток	39.7%	36.5%
Нестабильные тесты	6	2
Всего запусков	63	63
Стоимость за результат	0.306	1.267
Общая стоимость	$0.020	$0.097
Цена входа	$0.269 / 1M	$0.950 / 1M
Цена выхода	$0.400 / 1M	$4.000 / 1M
Общее число входных токенов	55,997	32,916
Выходные токены	11,165	16,410
Токены рассуждений	0	0
Время ответа (среднее)	13.83s	13.27s
Время ответа (макс.)	115.89s	238.89s
Время ответа (суммарно)	290.43s	278.57s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#157 DeepSeek V3.2

none

Стоимость: $0.002
Время: 7.0s
Токены: 1,046 tok

#139 MoonshotAI: Kimi K2.6

none

Стоимость: $0.020
Время: 127.4s
Токены: 4,429 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.2	8.0	8.3%	1		9.35s	494	1,073	0
Kimi K2.6	4.6	10.0	25.0%	0		1.39s	618	471	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.1	6.9	11.1%	1		14.54s	7,279	4,528	0
Kimi K2.6	5.5	9.8	33.3%	0		82.57s	5,986	14,754	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	29,843	2,887	0
Kimi K2.6	3.0	10.0	0.0%	0		3.38s	11,269	290	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	7,890	1,710	0
Kimi K2.6	10.0	10.0	100.0%	0		1.32s	7,014	201	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	2.9	7.2	11.1%	1		4.17s	624	21	0
Kimi K2.6	5.3	7.2	44.4%	1		1.48s	732	42	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	4.7	1.6	66.7%	1		9.32s	314	43	0
Kimi K2.6	5.4	3.5	33.3%	1		1.55s	477	138	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	627	66	0
Kimi K2.6	6.5	10.0	50.0%	0		1.64s	669	72	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.6	7.2	77.8%	1		6.91s	424	298	0
Kimi K2.6	3.1	9.9	0.0%	0		1.40s	651	185	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	8,319	522	0
Kimi K2.6	10.0	10.0	100.0%	0		4.46s	5,286	240	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	183	17	0
Kimi K2.6	3.0	10.0	0.0%	0		1.36s	214	17	0

Быстрое сравнение

Сменить пару сравнения