AI BENCHY Compare

Qwen: Qwen3.6 Max Preview vs Xiaomi: MiMo-V2.5-Pro

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-08

Метрика	Qwen3.6 Max Preview Qwen3.6 Max Preview none Релиз: 2026-04-20	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Релиз: 2026-04-22

Метрика	Qwen3.6 Max Preview Qwen3.6 Max Preview none Релиз: 2026-04-20	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Релиз: 2026-04-22
Оценка	7.2	8.1
Ранг	#54	#18
Надежность	10.0	10.0
Стабильность	9.1	9.2
Тестов верно
Доля успешных попыток	64.9%	74.1%
Нестабильные тесты	2	2
Всего запусков	57	54
Стоимость за результат	0.755	1.661
Общая стоимость	$0.083	$0.200
???? ?????	$1.040 / 1M	$1.000 / 1M
???? ??????	$6.240 / 1M	$3.000 / 1M
Выходные токены	4,751	2,790
Токены рассуждений	0	52,001
Время ответа (среднее)	3.31s	16.23s
Время ответа (макс.)	20.51s	84.22s
Время ответа (суммарно)	62.80s	292.10s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Max Preview	5.2	7.9	41.7%	1		2.63s	513	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.26s	323	1,179

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Max Preview	5.0	2.0	66.7%	1		3.45s	426	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		32.58s	543	7,485

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Max Preview	3.0	10.0	0.0%	0		20.51s	2,842	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		53.36s	348	11,870

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		2.87s	243	0
MiMo-V2.5-Pro	7.3	5.8	83.3%	1		18.81s	260	8,383

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Max Preview	7.7	10.0	66.7%	0		1.22s	18	0
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		37.87s	275	17,023

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Max Preview	4.3	10.0	0.0%	0		1.62s	76	0
MiMo-V2.5-Pro	5.5	10.0	0.0%	0		4.02s	155	163

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Max Preview	9.8	10.0	100.0%	0		1.45s	69	0
MiMo-V2.5-Pro	9.9	10.0	100.0%	0		2.77s	82	803

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		2.38s	323	0
MiMo-V2.5-Pro	6.7	7.9	55.6%	1		5.16s	493	2,187

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		5.27s	222	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		16.87s	311	2,908

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Max Preview	3.0	10.0	0.0%	0		1.97s	19	0
MiMo-V2.5-Pro	-	-	-	-	-	-	-	-

Быстрое сравнение

Сменить пару сравнения

Qwen3.6 Max PreviewnonevsMiMo-V2-Flashmedium Seed-2.0-MinimediumvsQwen3.6 Max Previewnone GPT-5.2mediumvsQwen3.6 Max Previewnone GPT-5.4 NanomediumvsQwen3.6 Max Previewnone DeepSeek V3.2mediumvsQwen3.6 Max Previewnone GPT-5.4 MinimediumvsQwen3.6 Max Previewnone Qwen3.6 Max PreviewnonevsMiMo-V2-Omnimedium Claude Opus 4.6mediumvsQwen3.6 Max Previewnone Gemini 3 Flash PreviewnonevsMiMo-V2.5-Promedium Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2.5-Promedium Qwen3.6 Max PreviewnonevsGLM 5V Turbomedium DeepSeek V4 FlashhighvsQwen3.6 Max Previewnone