Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.7 Max vs Xiaomi: MiMo-V2.5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика Qwen3.7 Max Qwen3.7 Max none Релиз: 2026-05-22 MiMo-V2.5 MiMo-V2.5 medium Релиз: 2026-04-22
Оценка 7.9 7.8
Ранг #27 #30
Надежность 10.0 10.0
Стабильность 10.0 8.6
Тестов верно
Доля успешных попыток 70.0% 75.9%
Нестабильные тесты 0 3
Всего запусков 60 54
Стоимость за результат 0.719 2.101
Общая стоимость $0.101 $0.253
???? ????? $2.500 / 1M $0.400 / 1M
???? ?????? $7.500 / 1M $2.000 / 1M
Выходные токены 1,988 2,821
Токены рассуждений 0 116,207
Время ответа (среднее) 1.30s 14.40s
Время ответа (макс.) 3.92s 86.93s
Время ответа (суммарно) 25.95s 259.20s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 6.5 10.0 50.0% 0 1.08s 242 0
MiMo-V2.5 10.0 10.0 100.0% 0 4.14s 281 1,739
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 6.8 10.0 50.0% 0 1.39s 576 0
MiMo-V2.5 10.0 10.0 100.0% 0 31.48s 488 14,813
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 3.0 10.0 0.0% 0 2.17s 171 0
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 10.0 10.0 100.0% 0 1.35s 243 0
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 7.7 10.0 66.7% 0 975ms 15 0
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 10.0 10.0 100.0% 0 1.04s 120 0
MiMo-V2.5 5.4 2.5 66.7% 1 5.37s 121 418
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 10.0 10.0 100.0% 0 943ms 72 0
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 10.0 10.0 100.0% 0 1.13s 314 0
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 10.0 10.0 100.0% 0 3.92s 222 0
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 3.0 10.0 0.0% 0 856ms 13 0
MiMo-V2.5 - - - - - - - -

Быстрое сравнение

Сменить пару сравнения