AI BENCHY Compare

Qwen: Qwen3.6 27B vs Xiaomi: MiMo-V2-Omni

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика	Qwen3.6 27B Qwen3.6 27B medium Релиз: 2026-04-20	MiMo-V2-Omni MiMo-V2-Omni medium Релиз: 2026-03-18

Метрика	Qwen3.6 27B Qwen3.6 27B medium Релиз: 2026-04-20	MiMo-V2-Omni MiMo-V2-Omni medium Релиз: 2026-03-18
Оценка	6.6	6.9
Ранг	#83	#72
Надежность	9.9	10.0
Стабильность	8.1	8.7
Тестов верно
Доля успешных попыток	58.3%	58.3%
Нестабильные тесты	5	3
Всего запусков	60	52
Стоимость за результат	3.015	7.334
Общая стоимость	$0.272	$0.734
???? ?????	$0.317 / 1M	$0.400 / 1M
???? ??????	$3.200 / 1M	$2.000 / 1M
Выходные токены	13,007	1,952
Токены рассуждений	105,697	357,306
Время ответа (среднее)	57.65s	41.16s
Время ответа (макс.)	168.22s	299.23s
Время ответа (суммарно)	1153.04s	823.26s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 27B	8.3	10.0	75.0%	0		12.62s	582	4,311
MiMo-V2-Omni	10.0	10.0	100.0%	0		2.75s	269	1,701

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 27B	6.6	10.0	50.0%	0		165.39s	4,760	26,668
MiMo-V2-Omni	3.4	4.8	16.7%	1		183.89s	292	174,314

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 27B	7.0	3.7	66.7%	1		83.07s	2,088	14,689
MiMo-V2-Omni	10.0	10.0	100.0%	0		25.87s	380	8,673

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 27B	3.5	1.4	50.0%	2		37.30s	568	9,404
MiMo-V2-Omni	10.0	10.0	100.0%	0		3.04s	155	591

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 27B	2.9	7.2	11.1%	1		73.38s	3,510	20,352
MiMo-V2-Omni	3.0	10.0	0.0%	0		47.89s	155	68,398

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 27B	6.5	3.4	66.7%	1		39.53s	81	3,045
MiMo-V2-Omni	5.4	2.5	66.7%	1		3.61s	136	492

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 27B	10.0	10.0	100.0%	0		37.96s	346	6,548
MiMo-V2-Omni	8.3	10.0	50.0%	0		4.99s	49	515

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 27B	7.7	10.0	66.7%	0		60.21s	281	11,919
MiMo-V2-Omni	5.9	7.2	55.6%	1		2.38s	210	860

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 27B	10.0	10.0	100.0%	0		16.88s	390	2,954
MiMo-V2-Omni	10.0	10.0	100.0%	0		13.98s	303	3,461

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 27B	3.0	10.0	0.0%	0		80.99s	401	5,807
MiMo-V2-Omni	3.0	10.0	0.0%	0		234.19s	3	98,301

Быстрое сравнение

Сменить пару сравнения

Qwen3.6 27BmediumvsGrok Build 0.1none Gemini 3.1 Flash LitenonevsQwen3.6 27Bmedium GPT-5.5nonevsQwen3.6 27Bmedium DeepSeek V4 ProhighvsQwen3.6 27Bmedium Gemini 3.1 Flash LiteminimalvsQwen3.6 27Bmedium Claude Sonnet 4.6nonevsMiMo-V2-Omnimedium Gemma 4 31BnoneБесплатно доступноvsQwen3.6 27Bmedium Qwen3.6 Max PreviewnonevsMiMo-V2-Omnimedium Gemma 4 31BnoneБесплатно доступноvsMiMo-V2-Omnimedium Gemini 3.1 Flash LiteminimalvsMiMo-V2-Omnimedium DeepSeek V4 ProhighvsMiMo-V2-Omnimedium Qwen3.6 27BmediumvsGLM 5none