Kimi K2.6 (medium) vs Grok 4.3 (medium)

Kimi K2.6 (medium) лидирует по среднему баллу: 7.2 vs 7.1. Grok 4.3 (medium) имеет более низкую стоимость benchmark: $0.779 vs $0.831. Grok 4.3 (medium) быстрее: 47.45s vs 109.98s, с долей успешных попыток 63.6% vs 68.2%.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-28

Ранг: #78
Общее число выходных токенов: 391,540
Время ответа (среднее): 109.98s
Общая стоимость: $0.831

Ранг: #83
Общее число выходных токенов: 241,421
Время ответа (среднее): 47.45s
Общая стоимость: $0.779

Рекомендуемая модель Grok 4.3 (medium)

Его балл близок к лучшему здесь (7.1 против 7.2), и он отвечает примерно в 2.3 раза быстрее, чем Kimi K2.6 (medium).

Подробное сравнение

Метрика	Kimi K2.6 Kimi K2.6 medium Релиз: 2026-04-20	Grok 4.3 Grok 4.3 medium Релиз: 2026-05-01

Метрика	Kimi K2.6 Kimi K2.6 medium Релиз: 2026-04-20	Grok 4.3 Grok 4.3 medium Релиз: 2026-05-01
Оценка	7.2	7.1
Ранг	#78	#83
Надежность	9.4	10.0
Стабильность	8.3	8.6
Тестов верно
Доля успешных попыток	63.6%	68.2%
Нестабильные тесты	4	4
Всего запусков	66	66
Стоимость за результат	9.821	5.990
Общая стоимость	$0.831	$0.779
Цена входа	$0.646 / 1M	$1.250 / 1M
Цена выхода	$2.720 / 1M	$2.500 / 1M
Общее число входных токенов	68,902	140,031
Выходные токены	111,680	13,739
Токены рассуждений	279,860	227,682
Время ответа (среднее)	109.98s	47.45s
Время ответа (макс.)	876.20s	216.69s
Время ответа (суммарно)	2309.56s	1043.83s

Генерация showcase моделей

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#78 MoonshotAI: Kimi K2.6

medium

Стоимость: $0.013
Время: 103.4s
Токены: 3,620 tok

#83 xAI: Grok 4.3

medium

Стоимость: $0.009
Время: 19.0s
Токены: 3,661 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Kimi K2.6	7.0	8.0	66.7%	1		11.59s	618	7,115	8,934
Grok 4.3	10.0	10.0	100.0%	0		8.83s	2,010	88	8,207

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Kimi K2.6	5.7	8.6	33.3%	0		214.42s	2,925	9,970	77,189
Grok 4.3	5.9	7.7	44.4%	1		41.23s	8,340	1,028	31,226

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Kimi K2.6	6.9	5.9	66.7%	1		458.58s	50,723	9,468	39,642
Grok 4.3	6.5	10.0	50.0%	0		55.07s	108,468	11,992	21,601

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Kimi K2.6	10.0	10.0	100.0%	0		20.38s	7,014	316	11,305
Grok 4.3	10.0	10.0	100.0%	0		18.97s	7,761	180	9,546

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Kimi K2.6	5.3	7.2	44.4%	1		202.38s	326	47,035	98,262
Grok 4.3	5.3	7.2	44.4%	1		181.74s	1,764	14	111,300

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Kimi K2.6	10.0	10.0	100.0%	0		17.83s	477	3,981	4,472
Grok 4.3	5.4	2.5	66.7%	1		24.70s	825	70	5,020

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Kimi K2.6	10.0	10.0	100.0%	0		12.53s	669	3,977	5,269
Grok 4.3	9.8	10.0	100.0%	0		18.58s	1,362	57	8,713

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Kimi K2.6	6.0	7.4	55.6%	1		25.06s	651	13,860	17,599
Grok 4.3	5.9	7.2	55.6%	1		22.52s	1,689	128	14,468

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Kimi K2.6	10.0	10.0	100.0%	0		8.92s	5,286	248	1,011
Grok 4.3	10.0	10.0	100.0%	0		17.66s	7,263	168	4,615

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Kimi K2.6	3.0	10.0	0.0%	0		130.27s	213	15,710	16,177
Grok 4.3	3.0	10.0	0.0%	0		44.47s	549	14	12,986

Быстрое сравнение

Сменить пару сравнения

KAT-Coder-Pro V2.5highvsKimi K2.6medium Kimi K2.6mediumvsStep 3.7 Flashlow Qwen3.7 PlusnonevsGrok 4.3medium Claude Opus 4.8nonevsKimi K2.6medium Kimi K2.6mediumvsQwen3.7 Flashlow Kimi K2.6mediumvsQwen3.7 Plusnone KAT-Coder-Pro V2.5highvsGrok 4.3medium Claude Sonnet 4.6nonevsKimi K2.6medium Step 3.7 FlashlowvsGrok 4.3medium Claude Opus 4.8nonevsGrok 4.3medium KAT-Coder-Pro V2.5lowvsKimi K2.6medium Qwen3.7 FlashlowvsGrok 4.3medium