Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs Qwen: Qwen3.5-35B-A3B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-01

Метрика Kimi K2.5 Kimi K2.5 medium Релиз: 2026-01-27 Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Релиз: 2026-02-24
Оценка 7.0 7.4
Ранг #60 #57
Надежность Н/Д Н/Д
Стабильность 6.8 6.7
Тестов верно
Доля успешных попыток 72.2% 79.6%
Нестабильные тесты 7 7
Всего запусков 54 54
Стоимость за результат 2.444 3.976
Общая стоимость $0.220 $0.398
???? ????? $0.440 / 1M $0.163 / 1M
???? ?????? $2.000 / 1M $1.300 / 1M
Выходные токены 42,176 10,137
Токены рассуждений 84,870 208,761
Время ответа (среднее) 72.43s 44.51s
Время ответа (макс.) 150.77s 106.00s
Время ответа (суммарно) 796.70s 801.21s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 2,789 8,880
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 21.13s 798 42,652
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.5 4.7 1.6 66.7% 1 150.77s 1,269 9,749
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 79.09s 4,273 33,078
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 703 3,713
Qwen3.5-35B-A3B 4.7 1.6 66.7% 1 75.34s 775 12,485
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 563 7,940
Qwen3.5-35B-A3B 7.3 5.9 83.3% 1 59.33s 235 19,493
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 20,753 30,564
Qwen3.5-35B-A3B 4.1 4.4 44.5% 2 88.34s 41 46,368
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 3,815 4,262
Qwen3.5-35B-A3B 2.8 1.6 33.3% 1 30.30s 20 3,753
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 5,371 6,547
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 24.45s 97 17,361
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.5 5.3 7.3 44.4% 1 45.40s 6,671 12,403
Qwen3.5-35B-A3B 6.4 4.4 77.8% 2 31.58s 3,589 32,206
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 242 812
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 4.65s 309 1,365

Быстрое сравнение

Сменить пару сравнения