Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs MoonshotAI: Kimi K2.6

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-04

Метрика Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Релиз: 2026-03-03 Kimi K2.6 Kimi K2.6 medium Релиз: 2026-04-20 Бесплатно доступно
Оценка 7.2 7.2
Ранг #58 #60
Надежность 10.0 10.0
Стабильность 9.7 8.6
Тестов верно
Доля успешных попыток 60.3% 65.1%
Нестабильные тесты 1 3
Всего запусков 63 63
Стоимость за результат 0.148 8.358
Общая стоимость $0.018 $0.891
Цена входа $0.250 / 1M $0.684 / 1M
Цена выхода $1.500 / 1M $3.420 / 1M
Общее число входных токенов 37,582 29,450
Выходные токены 5,547 102,923
Токены рассуждений 0 254,094
Время ответа (среднее) 1.21s 71.67s
Время ответа (макс.) 3.39s 406.78s
Время ответа (суммарно) 25.45s 1433.36s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 7.5 8.4 66.7% 1 1.04s 504 1,092 0
Kimi K2.6 7.0 8.0 66.7% 1 11.59s 618 7,115 8,934
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 5.5 10.0 33.3% 0 967ms 8,128 670 0
Kimi K2.6 5.7 8.6 33.3% 0 214.42s 2,925 9,970 77,189
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 3.20s 13,026 339 0
Kimi K2.6 10.0 10.0 100.0% 0 40.96s 11,271 711 13,876
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.22s 7,550 399 0
Kimi K2.6 10.0 10.0 100.0% 0 20.38s 7,014 316 11,305
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 942ms 641 568 0
Kimi K2.6 5.3 7.2 44.4% 1 202.38s 326 47,035 98,262
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 741ms 488 69 0
Kimi K2.6 10.0 10.0 100.0% 0 17.83s 477 3,981 4,472
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.13s 623 574 0
Kimi K2.6 10.0 10.0 100.0% 0 12.53s 669 3,977 5,269
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 900ms 570 1,045 0
Kimi K2.6 6.0 7.4 55.6% 1 25.06s 651 13,860 17,599
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.39s 5,894 782 0
Kimi K2.6 10.0 10.0 100.0% 0 8.92s 5,286 248 1,011
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 814ms 158 9 0
Kimi K2.6 3.0 10.0 0.0% 0 130.27s 213 15,710 16,177

Быстрое сравнение

Сменить пару сравнения