Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Xiaomi: MiMo-V2.5-Pro vs Z.ai: GLM 4.7 Flash

Сводка

Сравнение benchmark MiMo-V2.5-Pro vs GLM 4.7 Flash: MiMo-V2.5-Pro лидирует по среднему баллу: 5.5 vs 4.9. GLM 4.7 Flash имеет более низкую стоимость benchmark: $0.004 vs $0.017. MiMo-V2.5-Pro быстрее: 1.78s vs 2.86s, с долей успешных попыток 39.7% vs 36.5%.

Рекомендуемая модель: MiMo-V2.5-Pro - Здесь у него лучший балл (5.5), и он отвечает примерно в 1.6 раза быстрее, чем GLM 4.7 Flash.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-02

Метрика MiMo-V2.5-Pro MiMo-V2.5-Pro none Релиз: 2026-04-22 GLM 4.7 Flash GLM 4.7 Flash none Релиз: 2026-01-19
Оценка 5.5 4.9
Ранг #123 #146
Надежность 10.0 10.0
Стабильность 8.6 8.8
Тестов верно
Доля успешных попыток 39.7% 36.5%
Нестабильные тесты 4 3
Всего запусков 63 63
Стоимость за результат 0.648 0.056
Общая стоимость $0.017 $0.004
Цена входа $0.435 / 1M $0.060 / 1M
Цена выхода $0.870 / 1M $0.400 / 1M
Общее число входных токенов 30,724 38,745
Выходные токены 3,043 2,521
Токены рассуждений 0 0
Время ответа (среднее) 1.78s 2.86s
Время ответа (макс.) 8.32s 7.05s
Время ответа (суммарно) 37.42s 40.04s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#123 MiMo-V2.5-Pro

none
Стоимость
$0.004
Время
46.4s
Токены
4,025 tok

#146 GLM 4.7 Flash

none
Неверный SVG
Стоимость
$0.000
Время
300.0s
Токены
0 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
MiMo-V2.5-Pro 3.3 8.1 8.3% 1 2.67s 645 994 0
GLM 4.7 Flash 5.2 7.9 41.7% 1 5.51s 555 438 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
MiMo-V2.5-Pro 4.3 7.8 22.2% 1 1.41s 6,559 485 0
GLM 4.7 Flash 4.3 10.0 0.0% 0 2.54s 7,256 650 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 3.54s 4,695 596 0
GLM 4.7 Flash 3.0 10.0 0.0% 0 3.22s 14,325 704 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 1.32s 7,758 249 0
GLM 4.7 Flash 7.3 5.8 83.3% 1 4.82s 7,107 196 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 877ms 753 27 0
GLM 4.7 Flash 7.7 10.0 66.7% 0 744ms 687 19 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
MiMo-V2.5-Pro 4.0 10.0 0.0% 0 2.58s 498 87 0
GLM 4.7 Flash 4.0 10.0 0.0% 0 1.59s 477 134 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
MiMo-V2.5-Pro 6.4 10.0 50.0% 0 1.03s 684 66 0
GLM 4.7 Flash 6.5 10.0 50.0% 0 888ms 636 62 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
MiMo-V2.5-Pro 6.7 4.7 77.8% 2 1.30s 678 267 0
GLM 4.7 Flash 6.4 10.0 33.3% 0 1.20s 609 97 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.30s 8,238 258 0
GLM 4.7 Flash 2.8 1.6 33.3% 1 7.05s 6,907 212 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 1.89s 216 14 0
GLM 4.7 Flash 3.0 10.0 0.0% 0 692ms 186 9 0

Быстрое сравнение

Сменить пару сравнения