Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs Z.ai: GLM 4.7 Flash

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика Kimi K2.5 Kimi K2.5 none Релиз: 2026-01-27 GLM 4.7 Flash GLM 4.7 Flash none Релиз: 2026-01-19
Оценка 5.3 5.6
Ранг #126 #109
Надежность 10.0 10.0
Стабильность 8.9 8.7
Тестов верно
Доля успешных попыток 36.7% 38.3%
Нестабильные тесты 3 3
Всего запусков 60 60
Стоимость за результат 0.428 0.053
Общая стоимость $0.026 $0.004
???? ????? $0.400 / 1M $0.060 / 1M
???? ?????? $1.900 / 1M $0.400 / 1M
Выходные токены 6,734 2,516
Токены рассуждений 0 0
Время ответа (среднее) 14.16s 2.98s
Время ответа (макс.) 42.13s 7.05s
Время ответа (суммарно) 184.10s 38.73s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 373 0
GLM 4.7 Flash 5.2 7.9 41.7% 1 5.51s 438 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.5 6.8 10.0 50.0% 0 35.97s 4,704 0
GLM 4.7 Flash 5.0 10.0 0.0% 0 3.35s 644 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 748 0
GLM 4.7 Flash 3.0 10.0 0.0% 0 3.22s 704 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 187 0
GLM 4.7 Flash 7.3 5.8 83.3% 1 4.82s 196 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 29 0
GLM 4.7 Flash 7.7 10.0 66.7% 0 744ms 19 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
GLM 4.7 Flash 4.0 10.0 0.0% 0 1.59s 134 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 60 0
GLM 4.7 Flash 6.5 10.0 50.0% 0 888ms 62 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.5 3.0 10.0 0.0% 0 4.73s 317 0
GLM 4.7 Flash 6.4 10.0 33.3% 0 1.00s 98 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0
GLM 4.7 Flash 2.8 1.6 33.3% 1 7.05s 212 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.5 3.0 10.0 0.0% 0 3.90s 20 0
GLM 4.7 Flash 3.0 10.0 0.0% 0 692ms 9 0

Быстрое сравнение

Сменить пару сравнения