Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

Ling 2.6 Flash vs MoonshotAI: Kimi K2.5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-22

Метрика Ling 2.6 Flash Ling 2.6 Flash none Релиз: 2026-04-21 Бесплатно доступно Kimi K2.5 Kimi K2.5 none Релиз: 2026-01-27
Оценка 5.4 5.5
Ранг #78 #76
Стабильность 9.5 8.7
Тестов верно
Доля успешных попыток 35.2% 40.7%
Нестабильные тесты 1 3
Всего запусков 52 54
Стоимость за результат 0.000 0.271
Общая стоимость $0.000 $0.017
???? ????? $0.000 / 1M $0.440 / 1M
???? ?????? $0.000 / 1M $2.000 / 1M
Выходные токены 3,338 2,659
Токены рассуждений 0 0
Время ответа (среднее) 11.33s 13.37s
Время ответа (макс.) 35.34s 42.13s
Время ответа (суммарно) 203.88s 147.05s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 Flash 6.5 10.0 50.0% 0 12.30s 1,064 0
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 373 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 Flash 10.0 10.0 100.0% 0 11.21s 381 0
Kimi K2.5 10.0 10.0 100.0% 0 38.78s 649 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 Flash 3.0 10.0 0.0% 0 35.34s 1,069 0
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 748 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 Flash 6.5 10.0 50.0% 0 8.48s 246 0
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 187 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 Flash 3.0 10.0 0.0% 0 4.94s 20 0
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 29 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 Flash 4.1 10.0 0.0% 0 11.85s 106 0
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 Flash 9.8 10.0 100.0% 0 5.52s 81 0
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 60 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 Flash 2.9 7.2 11.1% 1 11.55s 142 0
Kimi K2.5 3.1 10.0 0.0% 0 4.73s 317 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 Flash 3.0 10.0 0.0% 0 18.80s 229 0
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0

Быстрое сравнение

Сменить пару сравнения