AI BENCHY
Сравнить
❤️ Made by XCS

Название модели

MoonshotAI: Kimi K2.5

Бенчмарки сгенерированы из тестовых наборов Aibenchy в : 19 февр. 2026 г.

Метрика MoonshotAI: Kimi K2.5
Ранг#9
КомпанияMoonshotAI
Score 6.42
Стабильность 8.00
Стоимость за результат 2.4097
Общая стоимость $0.16868
Тестов верно 7/12
Доля успешных попыток 72.2%
Нестабильные тесты 3
Выходные токены 30,235
Токены рассуждений 53,179

Разбивка по категориям

Категория Полностью пройденные тесты Score Стабильность Доля успешных попыток Нестабильные тесты Оценка рассуждения Стоимость
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 9.77 $0.00634
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.67 $0.02325
Domain specific 0/3 1.00 4.41 33.3% 2 7.22 $0.09579
Instructions following 2/2 9.50 10.00 100.0% 0 9.42 $0.01428
Puzzle Solving 1/3 5.00 7.61 55.6% 1 9.26 $0.02904

Сравниваемые модели

Сравнить MoonshotAI: Kimi K2.5 с...

#8 · X Ai

xAI: Grok 4.1 Fast

Рассуждение (medium)

Score: 6.42

Стабильность: 8.60

Доля успешных попыток: 66.7%

Нестабильные тесты: 2

Стоимость за результат: 0.4800

Тестов верно: 7/12

Общая стоимость: $0.03360

Сравнить

#10 · Google

Google: Gemini 3 Flash Preview

Без рассуждения

Score: 6.25

Стабильность: 8.60

Доля успешных попыток: 66.7%

Нестабильные тесты: 2

Стоимость за результат: 0.0754

Тестов верно: 7/12

Общая стоимость: $0.00528

Сравнить

#7 · Z.ai

Z.ai: GLM 5

Рассуждение (medium)

Score: 6.83

Стабильность: 7.86

Доля успешных попыток: 80.6%

Нестабильные тесты: 3

Стоимость за результат: 1.3424

Тестов верно: 8/12

Общая стоимость: $0.10740

Сравнить

Быстрое сравнение

Сравнить MoonshotAI: Kimi K2.5 с...