AI BENCHY Compare

Qwen3.6 Plus Preview vs Xiaomi: MiMo-V2.5-Pro

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-22

Метрика	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Релиз: 2026-03-30 Бесплатно доступно	MiMo-V2.5-Pro MiMo-V2.5-Pro none Релиз: 2026-04-22

Метрика	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Релиз: 2026-03-30 Бесплатно доступно	MiMo-V2.5-Pro MiMo-V2.5-Pro none Релиз: 2026-04-22
Оценка	8.5	5.8
Ранг	#9	#72
Стабильность	10.0	8.3
Тестов верно
Доля успешных попыток	76.5%	46.3%
Нестабильные тесты	0	4
Всего запусков	49	54
Стоимость за результат	0.000	0.535
Общая стоимость	$0.000	$0.033
???? ?????	$0.000 / 1M	$1.000 / 1M
???? ??????	$0.000 / 1M	$3.000 / 1M
Выходные токены	1,756	2,451
Токены рассуждений	77,213	0
Время ответа (среднее)	13.94s	1.51s
Время ответа (макс.)	43.55s	3.54s
Время ответа (суммарно)	237.01s	27.21s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		9.90s	207	7,557
MiMo-V2.5-Pro	2.9	7.9	8.3%	1		1.29s	366	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		34.95s	452	13,073
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		3.54s	596	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		14.95s	270	10,706
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		1.32s	249	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Plus Preview	3.0	10.0	0.0%	0		22.08s	49	26,895
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		877ms	27	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Plus Preview	5.1	10.0	0.0%	0		27.05s	111	5,232
MiMo-V2.5-Pro	4.5	10.0	0.0%	0		1.53s	140	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		7.54s	102	5,552
MiMo-V2.5-Pro	6.4	10.0	50.0%	0		1.03s	66	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		6.11s	298	6,868
MiMo-V2.5-Pro	6.7	4.7	77.8%	2		1.32s	297	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		5.87s	267	1,330
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.30s	258	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Plus Preview	-	-	-	-	-	-	-	-
MiMo-V2.5-Pro	6.4	3.3	66.7%	1		2.39s	452	0

Быстрое сравнение

Сменить пару сравнения

gpt-oss-120bmediumБесплатно доступноvsMiMo-V2.5-Pronone MiniMax M2.5mediumБесплатно доступноvsMiMo-V2.5-Pronone Mistral Small 4mediumvsMiMo-V2.5-Pronone Gemini 3 Flash PreviewnonevsQwen3.6 Plus PreviewmediumБесплатно доступно Gemini 3 Flash PreviewlowvsQwen3.6 Plus PreviewmediumБесплатно доступно Gemini 3.1 Flash Lite PreviewlowvsQwen3.6 Plus PreviewmediumБесплатно доступно GPT-5 NanomediumvsMiMo-V2.5-Pronone MiniMax M2.7mediumvsMiMo-V2.5-Pronone GPT-5.2 ChatnonevsQwen3.6 Plus PreviewmediumБесплатно доступно Elephant AlphamediumvsMiMo-V2.5-Pronone Gemini 3.1 Flash Lite PreviewnonevsQwen3.6 Plus PreviewmediumБесплатно доступно Mercury 2mediumvsMiMo-V2.5-Pronone