Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs Qwen: Qwen3.7 Plus

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-03

Метрика Kimi K2.5 Kimi K2.5 medium Релиз: 2026-01-27 Qwen3.7 Plus Qwen3.7 Plus none Релиз: 2026-06-03
Оценка 6.7 6.6
Ранг #81 #82
Надежность 10.0 10.0
Стабильность 6.8 10.0
Тестов верно
Доля успешных попыток 66.7% 50.0%
Нестабильные тесты 8 0
Всего запусков 60 60
Стоимость за результат 3.486 0.264
Общая стоимость $0.272 $0.027
Цена входа $0.400 / 1M $0.400 / 1M
Цена выхода $1.900 / 1M $1.600 / 1M
Общее число входных токенов 31,717 39,669
Выходные токены 48,374 6,572
Токены рассуждений 128,473 0
Время ответа (среднее) 89.02s 2.95s
Время ответа (макс.) 281.00s 29.38s
Время ответа (суммарно) 1157.32s 58.96s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 634 2,789 8,880
Qwen3.7 Plus 6.5 10.0 50.0% 0 1.38s 696 349 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.5 4.1 1.9 50.0% 2 215.89s 4,340 5,700 45,419
Qwen3.7 Plus 6.8 10.0 50.0% 0 2.77s 5,070 633 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 11,280 703 3,713
Qwen3.7 Plus 10.0 10.0 100.0% 0 29.38s 14,952 4,505 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 7,020 563 7,940
Qwen3.7 Plus 10.0 10.0 100.0% 0 1.43s 7,794 243 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 485 20,753 30,564
Qwen3.7 Plus 3.0 10.0 0.0% 0 868ms 789 18 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 480 3,815 4,262
Qwen3.7 Plus 5.3 10.0 0.0% 0 1.33s 522 78 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 675 5,371 6,547
Qwen3.7 Plus 6.3 10.0 50.0% 0 929ms 711 72 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.5 5.3 7.3 44.4% 1 43.23s 659 8,426 12,692
Qwen3.7 Plus 7.7 10.0 66.7% 0 1.71s 714 443 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 5,933 242 812
Qwen3.7 Plus 10.0 10.0 100.0% 0 3.54s 8,211 222 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Kimi K2.5 3.0 10.0 0.0% 0 83.95s 211 12 7,644
Qwen3.7 Plus 3.0 10.0 0.0% 0 1.21s 210 9 0

Быстрое сравнение

Сменить пару сравнения