AI BENCHY
Your ad here

#40

Kimi K2.5

Moonshot AI · Релиз: 2026-01-27 · moonshotai/kimi-k2.5::medium

Стабильность

7.2

Общее число выходных токенов

116,028

???? ?????

$0.383 / 1M

???? ??????

$1.720 / 1M

Тестов верно

Ошибочных тестов: 8

Доля успешных попыток: 72.6%

Нестабильные тесты

6

Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).

Время ответа (среднее)

64.59s

Время ответа (макс.): 137.29s

Время ответа (суммарно): 645.93s

Графики

Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Быстрое сравнение

Разбивка по категориям

Категория Оценка Стабильность Тестов верно
Анти-ИИ уловки 7.3 5.8
Комбинированный 10.0 10.0
Парсинг и извлечение данных 10.0 10.0
Предметно-ориентированное 3.5 4.4
Общий интеллект 6.5 3.4
Следование инструкциям 10.0 10.0
Решение головоломок 5.3 7.3
Вызов инструментов 10.0 10.0

Сравниваемые модели