Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

MoonshotAI: Kimi K2.6 vs Z.ai: GLM 5.1

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-29

Метрика Kimi K2.6 Kimi K2.6 none Релиз: 2026-04-20 Бесплатно доступно GLM 5.1 GLM 5.1 none Релиз: 2026-04-07
Оценка 5.6 5.8
Ранг #119 #108
Надежность 10.0 10.0
Стабильность 9.2 8.4
Тестов верно
Доля успешных попыток 38.3% 43.3%
Нестабильные тесты 2 4
Всего запусков 60 60
Стоимость за результат 1.241 0.806
Общая стоимость $0.087 $0.057
Цена входа $0.730 / 1M $0.980 / 1M
Цена выхода $3.490 / 1M $3.080 / 1M
Выходные токены 16,405 3,748
Токены рассуждений 0 0
Время ответа (среднее) 13.82s 4.20s
Время ответа (макс.) 238.89s 32.57s
Время ответа (суммарно) 276.39s 83.95s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.6 4.6 10.0 25.0% 0 1.39s 471 0
GLM 5.1 4.0 6.3 25.0% 2 2.11s 305 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.6 7.1 9.8 50.0% 0 122.77s 14,749 0
GLM 5.1 4.3 9.5 0.0% 0 6.33s 519 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.6 3.0 10.0 0.0% 0 3.38s 290 0
GLM 5.1 2.8 2.1 33.3% 1 32.57s 2,129 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.6 10.0 10.0 100.0% 0 1.32s 201 0
GLM 5.1 10.0 10.0 100.0% 0 1.08s 204 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.6 5.3 7.2 44.4% 1 1.48s 42 0
GLM 5.1 2.9 7.2 11.1% 1 1.99s 24 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.6 5.4 3.5 33.3% 1 1.55s 138 0
GLM 5.1 5.0 10.0 0.0% 0 790ms 39 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.6 6.5 10.0 50.0% 0 1.64s 72 0
GLM 5.1 9.8 10.0 100.0% 0 1.98s 66 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.6 3.1 9.9 0.0% 0 1.40s 185 0
GLM 5.1 7.7 10.0 66.7% 0 1.45s 151 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.6 10.0 10.0 100.0% 0 4.46s 240 0
GLM 5.1 10.0 10.0 100.0% 0 10.68s 300 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.6 3.0 10.0 0.0% 0 1.36s 17 0
GLM 5.1 3.0 10.0 0.0% 0 2.34s 11 0

Быстрое сравнение

Сменить пару сравнения