Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs MoonshotAI: Kimi K2.6

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-04

Метрика Gemini 3.5 Flash Gemini 3.5 Flash low Релиз: 2026-05-19 Kimi K2.6 Kimi K2.6 medium Релиз: 2026-04-20 Бесплатно доступно
Оценка 9.4 7.2
Ранг #3 #60
Надежность 10.0 10.0
Стабильность 10.0 8.6
Тестов верно
Доля успешных попыток 90.5% 65.1%
Нестабильные тесты 0 3
Всего запусков 63 63
Стоимость за результат 1.834 8.358
Общая стоимость $0.349 $0.891
Цена входа $1.500 / 1M $0.684 / 1M
Цена выхода $9.000 / 1M $3.420 / 1M
Общее число входных токенов 36,938 29,450
Выходные токены 2,033 102,923
Токены рассуждений 30,519 254,094
Время ответа (среднее) 3.27s 71.67s
Время ответа (макс.) 9.05s 406.78s
Время ответа (суммарно) 68.65s 1433.36s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.52s 494 209 2,536
Kimi K2.6 7.0 8.0 66.7% 1 11.59s 618 7,115 8,934
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 7.8 10.0 66.7% 0 6.71s 8,118 458 13,420
Kimi K2.6 5.7 8.6 33.3% 0 214.42s 2,925 9,970 77,189
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.44s 12,873 351 3,050
Kimi K2.6 10.0 10.0 100.0% 0 40.96s 11,271 711 13,876
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.81s 7,548 279 1,164
Kimi K2.6 10.0 10.0 100.0% 0 20.38s 7,014 316 11,305
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 7.7 10.0 66.7% 0 3.39s 633 12 4,538
Kimi K2.6 5.3 7.2 44.4% 1 202.38s 326 47,035 98,262
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.27s 486 119 916
Kimi K2.6 10.0 10.0 100.0% 0 17.83s 477 3,981 4,472
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 9.9 10.0 100.0% 0 1.86s 615 71 1,652
Kimi K2.6 10.0 10.0 100.0% 0 12.53s 669 3,977 5,269
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.35s 558 288 2,150
Kimi K2.6 6.0 7.4 55.6% 1 25.06s 651 13,860 17,599
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.27s 5,457 234 403
Kimi K2.6 10.0 10.0 100.0% 0 8.92s 5,286 248 1,011
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.88s 156 12 690
Kimi K2.6 3.0 10.0 0.0% 0 130.27s 213 15,710 16,177

Быстрое сравнение

Сменить пару сравнения