AI BENCHY Compare

Qwen: Qwen3.5-27B vs Xiaomi: MiMo-V2-Omni

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-14

Метрика	Qwen3.5-27B Qwen3.5-27B medium Релиз: 2026-02-24	MiMo-V2-Omni MiMo-V2-Omni none Релиз: 2026-03-18

Метрика	Qwen3.5-27B Qwen3.5-27B medium Релиз: 2026-02-24	MiMo-V2-Omni MiMo-V2-Omni none Релиз: 2026-03-18
Оценка	8.4	6.5
Ранг	#8	#52
Стабильность	8.8	10.0
Тестов верно
Доля успешных попыток	81.5%	44.4%
Нестабильные тесты	3	0
Всего запусков	54	20
Стоимость за результат	3.822	0.083
Общая стоимость	$0.497	$0.007
???? ?????	$0.195 / 1M	$0.400 / 1M
???? ??????	$1.560 / 1M	$2.000 / 1M
Выходные токены	2,500	868
Токены рассуждений	242,500	0
Время ответа (среднее)	53.03s	1.99s
Время ответа (макс.)	163.96s	6.81s
Время ответа (суммарно)	954.46s	35.81s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-27B	8.7	7.9	91.7%	1		19.75s	569	31,505
MiMo-V2-Omni	4.8	10.0	25.0%	0		1.10s	74	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-27B	10.0	10.0	100.0%	0		70.35s	375	19,165
MiMo-V2-Omni	6.6	10.0	0.0%	0		1.72s	399	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-27B	10.0	10.0	100.0%	0		163.96s	483	9,991
MiMo-V2-Omni	3.0	10.0	0.0%	0		2.47s	110	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-27B	10.0	10.0	100.0%	0		30.26s	270	16,150
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.69s	83	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-27B	5.3	10.0	33.3%	0		79.53s	43	52,368
MiMo-V2-Omni	5.3	10.0	33.3%	0		1.14s	8	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-27B	6.1	3.1	66.7%	1		101.41s	70	23,147
MiMo-V2-Omni	4.5	10.0	0.0%	0		1.19s	37	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-27B	10.0	10.0	100.0%	0		19.66s	97	11,638
MiMo-V2-Omni	6.5	10.0	50.0%	0		4.18s	22	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-27B	8.2	7.7	77.8%	1		64.61s	245	77,213
MiMo-V2-Omni	8.0	10.0	66.7%	0		2.71s	58	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-27B	10.0	10.0	100.0%	0		7.45s	348	1,323
MiMo-V2-Omni	10.0	10.0	100.0%	0		2.76s	77	0

Быстрое сравнение

Сменить пару сравнения

Mercury 2mediumvsMiMo-V2-Omninone GPT-5 NanomediumvsMiMo-V2-Omninone Grok 4.1 FastmediumvsMiMo-V2-Omninone Nemotron 3 SupermediumБесплатно доступноvsMiMo-V2-Omninone Gemini 3 Flash PreviewnonevsQwen3.5-27Bmedium Gemini 3.1 Flash Lite PreviewlowvsQwen3.5-27Bmedium Gemini 3 Flash PreviewlowvsQwen3.5-27Bmedium Grok 4.20mediumvsMiMo-V2-Omninone GPT-5.2 ChatnonevsQwen3.5-27Bmedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-27Bmedium Kimi K2.5mediumvsMiMo-V2-Omninone GPT-5 MinimediumvsMiMo-V2-Omninone