Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs MoonshotAI: Kimi K2.5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-29

Метрика Gemini 3 Flash Preview Gemini 3 Flash Preview medium Релиз: 2025-12-17 Kimi K2.5 Kimi K2.5 none Релиз: 2026-01-27
Оценка 10.0 5.5
Ранг #1 #99
Надежность Н/Д Н/Д
Стабильность 10.0 8.7
Тестов верно
Доля успешных попыток 100.0% 40.7%
Нестабильные тесты 0 3
Всего запусков 18 54
Стоимость за результат 0.600 0.271
Общая стоимость $0.108 $0.017
???? ????? $0.500 / 1M $0.440 / 1M
???? ?????? $3.000 / 1M $2.000 / 1M
Выходные токены 655 2,659
Токены рассуждений 33,749 0
Время ответа (среднее) 12.11s 13.37s
Время ответа (макс.) 82.37s 42.13s
Время ответа (суммарно) 217.93s 147.05s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.26s 110 1,076
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 373 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 82.37s 144 16,257
Kimi K2.5 10.0 10.0 100.0% 0 38.78s 649 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 23.58s 117 3,495
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 748 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 7.62s 93 2,197
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 187 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 14.81s 4 7,228
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 29 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.34s 24 635
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.30s 24 903
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 60 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.86s 61 1,455
Kimi K2.5 3.1 10.0 0.0% 0 4.73s 317 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.78s 78 503
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0

Быстрое сравнение

Сменить пару сравнения