AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs Xiaomi: MiMo-V2-Omni

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-10

Метрика	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none Релиз: 2026-02-15	MiMo-V2-Omni MiMo-V2-Omni medium Релиз: 2026-03-18

Метрика	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none Релиз: 2026-02-15	MiMo-V2-Omni MiMo-V2-Omni medium Релиз: 2026-03-18
Оценка	6.5	7.2
Ранг	#78	#64
Надежность	10.0	10.0
Стабильность	9.3	9.1
Тестов верно
Доля успешных попыток	50.9%	59.7%
Нестабильные тесты	2	2
Всего запусков	57	49
Стоимость за результат	0.183	4.504
Общая стоимость	$0.017	$0.451
???? ?????	$0.260 / 1M	$0.400 / 1M
???? ??????	$1.560 / 1M	$2.000 / 1M
Выходные токены	2,472	1,925
Токены рассуждений	0	216,652
Время ответа (среднее)	2.49s	27.58s
Время ответа (макс.)	6.65s	234.19s
Время ответа (суммарно)	32.33s	524.03s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	4.8	10.0	25.0%	0		1.91s	517	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		2.75s	269	1,701

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	6.3	3.7	33.3%	1		3.63s	443	0
MiMo-V2-Omni	4.0	7.9	0.0%	0		68.55s	265	33,660

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		6.65s	314	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		25.87s	380	8,673

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		1.89s	243	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		3.04s	155	591

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0		1.17s	17	0
MiMo-V2-Omni	3.0	10.0	0.0%	0		47.89s	155	68,398

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	4.4	3.0	33.3%	1		2.26s	117	0
MiMo-V2-Omni	5.4	2.5	66.7%	1		3.61s	136	492

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		1.67s	72	0
MiMo-V2-Omni	8.3	10.0	50.0%	0		4.99s	49	515

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	7.7	10.0	66.7%	0		2.82s	516	0
MiMo-V2-Omni	5.9	7.2	55.6%	1		2.38s	210	860

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		3.33s	222	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		13.98s	303	3,461

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		1.11s	11	0
MiMo-V2-Omni	3.0	10.0	0.0%	0		234.19s	3	98,301

Быстрое сравнение

Сменить пару сравнения

Claude Sonnet 4.6nonevsMiMo-V2-Omnimedium Ring 2.6 1tnoneБесплатно доступноvsMiMo-V2-Omnimedium Qwen3.6 Max PreviewnonevsMiMo-V2-Omnimedium Qwen3.5 Plus 2026-02-15nonevsGrok 4.1 Fastmedium Mercury 2mediumvsQwen3.5 Plus 2026-02-15none Kimi K2.5mediumvsQwen3.5 Plus 2026-02-15none Gemini 3.1 Flash LiteminimalvsQwen3.5 Plus 2026-02-15none GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none Gemma 4 31BnoneБесплатно доступноvsMiMo-V2-Omnimedium GPT-5 NanomediumvsQwen3.5 Plus 2026-02-15none Qwen3.5 Plus 2026-02-15nonevsGrok 4.20medium DeepSeek V4 ProhighvsQwen3.5 Plus 2026-02-15none