Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

MoonshotAI: Kimi K2.6 vs Elephant Alpha

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-04

Метрика Kimi K2.6 Kimi K2.6 none Релиз: 2026-04-20 Бесплатно доступно Elephant Alpha Elephant Alpha medium Релиз: 2026-04-14
Оценка 5.5 5.1
Ранг #124 #136
Надежность 10.0 Н/Д
Стабильность 9.2 9.7
Тестов верно
Доля успешных попыток 36.5% 30.2%
Нестабильные тесты 2 1
Всего запусков 63 63
Стоимость за результат 1.267 0.000
Общая стоимость $0.079 $0.000
Цена входа $0.684 / 1M $0.000 / 1M
Цена выхода $3.420 / 1M $0.000 / 1M
Общее число входных токенов 32,916 33,744
Выходные токены 16,410 2,596
Токены рассуждений 0 0
Время ответа (среднее) 13.27s 1.27s
Время ответа (макс.) 238.89s 3.70s
Время ответа (суммарно) 278.57s 22.82s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.6 4.6 10.0 25.0% 0 1.39s 618 471 0
Elephant Alpha 6.6 10.0 50.0% 0 1.19s 726 815 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.6 5.5 9.8 33.3% 0 82.57s 5,986 14,754 0
Elephant Alpha 3.7 7.8 11.1% 1 1.30s 813 365 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.6 3.0 10.0 0.0% 0 3.38s 11,269 290 0
Elephant Alpha 3.0 10.0 0.0% 0 3.70s 14,046 562 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.6 10.0 10.0 100.0% 0 1.32s 7,014 201 0
Elephant Alpha 6.5 10.0 50.0% 0 979ms 8,004 246 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.6 5.3 7.2 44.4% 1 1.48s 732 42 0
Elephant Alpha 3.0 10.0 0.0% 0 925ms 810 24 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.6 5.4 3.5 33.3% 1 1.55s 477 138 0
Elephant Alpha 4.3 10.0 0.0% 0 920ms 540 105 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.6 6.5 10.0 50.0% 0 1.64s 669 72 0
Elephant Alpha 9.8 10.0 100.0% 0 987ms 732 82 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.6 3.1 9.9 0.0% 0 1.40s 651 185 0
Elephant Alpha 5.3 10.0 33.3% 0 868ms 729 166 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.6 10.0 10.0 100.0% 0 4.46s 5,286 240 0
Elephant Alpha 3.0 10.0 0.0% 0 2.83s 7,344 231 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.6 3.0 10.0 0.0% 0 1.36s 214 17 0
Elephant Alpha 3.0 10.0 0.0% 0 0ms 0 0 0

Быстрое сравнение

Сменить пару сравнения