AI BENCHY Compare

Owl Alpha vs Xiaomi: MiMo-V2.5-Pro

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-30

Метрика	Owl Alpha Owl Alpha medium Релиз: 2026-04-30	MiMo-V2.5-Pro MiMo-V2.5-Pro none Релиз: 2026-04-22

Метрика	Owl Alpha Owl Alpha medium Релиз: 2026-04-30	MiMo-V2.5-Pro MiMo-V2.5-Pro none Релиз: 2026-04-22
Оценка	5.8	5.8
Ранг	#91	#94
Надежность	10.0	Н/Д
Стабильность	9.5	8.3
Тестов верно
Доля успешных попыток	40.7%	46.3%
Нестабильные тесты	1	4
Всего запусков	54	54
Стоимость за результат	0.000	0.535
Общая стоимость	$0.000	$0.033
???? ?????	$0.000 / 1M	$1.000 / 1M
???? ??????	$0.000 / 1M	$3.000 / 1M
Выходные токены	1,596	2,451
Токены рассуждений	0	0
Время ответа (среднее)	11.04s	1.51s
Время ответа (макс.)	58.63s	3.54s
Время ответа (суммарно)	198.65s	27.21s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Owl Alpha	4.8	10.0	25.0%	0		3.97s	87	0
MiMo-V2.5-Pro	2.9	7.9	8.3%	1		1.29s	366	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Owl Alpha	10.0	10.0	100.0%	0		7.35s	402	0
MiMo-V2.5-Pro	6.4	3.3	66.7%	1		2.39s	452	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Owl Alpha	3.0	10.0	0.0%	0		10.01s	315	0
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		3.54s	596	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Owl Alpha	10.0	10.0	100.0%	0		21.64s	246	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		1.32s	249	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Owl Alpha	5.3	10.0	33.3%	0		8.58s	28	0
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		877ms	27	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Owl Alpha	4.3	10.0	0.0%	0		58.63s	98	0
MiMo-V2.5-Pro	4.5	10.0	0.0%	0		1.53s	140	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Owl Alpha	6.3	10.0	50.0%	0		9.59s	57	0
MiMo-V2.5-Pro	6.4	10.0	50.0%	0		1.03s	66	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Owl Alpha	3.4	7.2	11.1%	1		3.44s	135	0
MiMo-V2.5-Pro	6.7	4.7	77.8%	2		1.32s	297	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Owl Alpha	10.0	10.0	100.0%	0		8.26s	228	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.30s	258	0

Быстрое сравнение

Сменить пару сравнения

Kimi K2.6nonevsOwl Alphamedium GPT-5.4nonevsOwl Alphamedium Owl AlphamediumvsQwen3.5-122B-A10Bnone Owl AlphamediumvsQwen3.5 Plus 2026-04-20none gpt-oss-120bmediumБесплатно доступноvsMiMo-V2.5-Pronone Owl AlphamediumvsQwen3.6 Flashnone Owl AlphamediumvsGLM 5.1none Mistral Small 4mediumvsMiMo-V2.5-Pronone MiniMax M2.5mediumБесплатно доступноvsMiMo-V2.5-Pronone Owl AlphamediumvsMiMo-V2-Pronone DeepSeek V3.2nonevsOwl Alphamedium Owl AlphamediumvsQwen3.5-27Bnone