Claude Opus 4.8 vs Kimi K2.7 Code (medium)

Kimi K2.7 Code (medium) лидирует по среднему баллу: 7.5 vs 7.3. Kimi K2.7 Code (medium) имеет более низкую стоимость benchmark: $0.692 vs $1.166. Claude Opus 4.8 быстрее: 4.91s vs 84.25s, с долей успешных попыток 63.6% vs 65.2%.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Ранг: #74
Общее число выходных токенов: 16,797
Время ответа (среднее): 4.91s
Общая стоимость: $1.166

Ранг: #60
Общее число выходных токенов: 262,507
Время ответа (среднее): 84.25s
Общая стоимость: $0.692

Рекомендуемая модель Claude Opus 4.8

Его балл близок к лучшему здесь (7.3 против 7.5), и он отвечает примерно в 17.2 раза быстрее, чем Kimi K2.7 Code (medium).

Подробное сравнение

Метрика	Claude Opus 4.8 Claude Opus 4.8 none Релиз: 2026-05-28	Kimi K2.7 Code Kimi K2.7 Code medium Релиз: 2026-06-12

Метрика	Claude Opus 4.8 Claude Opus 4.8 none Релиз: 2026-05-28	Kimi K2.7 Code Kimi K2.7 Code medium Релиз: 2026-06-12
Оценка	7.3	7.5
Ранг	#74	#60
Надежность	10.0	10.0
Стабильность	9.2	8.3
Тестов верно
Доля успешных попыток	63.6%	65.2%
Нестабильные тесты	2	4
Всего запусков	66	66
Стоимость за результат	8.969	6.457
Общая стоимость	$1.166	$0.692
Цена входа	$5.000 / 1M	$0.780 / 1M
Цена выхода	$25.000 / 1M	$3.500 / 1M
Общее число входных токенов	149,206	72,073
Выходные токены	16,797	83,714
Токены рассуждений	0	178,793
Время ответа (среднее)	4.91s	84.25s
Время ответа (макс.)	35.03s	365.80s
Время ответа (суммарно)	108.03s	1769.22s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#74 Claude Opus 4.8

none

Стоимость: $0.053
Время: 22.0s
Токены: 2,253 tok

#60 MoonshotAI: Kimi K2.7 Code

medium

Стоимость: $0.025
Время: 138.0s
Токены: 6,093 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.8	6.5	10.0	50.0%	0		3.40s	834	1,472	0
Kimi K2.7 Code	7.3	5.8	83.3%	2		11.56s	618	3,048	5,041

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.8	5.5	10.0	33.3%	0		3.29s	10,590	1,332	0
Kimi K2.7 Code	7.8	9.3	66.7%	0		146.73s	4,650	1,864	25,635

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.8	9.8	10.0	100.0%	0		26.38s	111,760	11,949	0
Kimi K2.7 Code	7.3	5.8	83.3%	1		66.03s	57,353	3,642	21,308

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.8	7.3	5.8	83.3%	1		1.77s	10,503	308	0
Kimi K2.7 Code	10.0	10.0	100.0%	0		12.27s	7,014	248	2,569

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.8	5.3	7.2	44.4%	1		1.70s	975	61	0
Kimi K2.7 Code	5.5	9.3	33.3%	0		213.29s	431	55,572	63,639

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.8	10.0	10.0	100.0%	0		3.48s	708	230	0
Kimi K2.7 Code	10.0	10.0	100.0%	0		10.78s	477	1,024	1,071

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.8	9.9	10.0	100.0%	0		1.37s	909	95	0
Kimi K2.7 Code	9.9	10.0	100.0%	0		5.39s	669	725	1,232

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.8	7.7	10.0	66.7%	0		2.74s	894	783	0
Kimi K2.7 Code	5.9	7.7	44.4%	1		41.00s	651	15,438	17,368

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.8	10.0	10.0	100.0%	0		5.35s	11,775	355	0
Kimi K2.7 Code	3.0	10.0	0.0%	0		0ms	0	0	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.8	3.0	10.0	0.0%	0		3.41s	258	212	0
Kimi K2.7 Code	3.0	10.0	0.0%	0		341.76s	210	2,153	40,930

Быстрое сравнение

Сменить пару сравнения