AI BENCHY Compare

Qwen: Qwen3.5-35B-A3B vs Xiaomi: MiMo-V2.5

Сводка

Сравнение benchmark Qwen3.5-35B-A3B (medium) vs MiMo-V2.5 (medium): MiMo-V2.5 (medium) лидирует по среднему баллу: 6.7 vs 6.3. MiMo-V2.5 (medium) имеет более низкую стоимость benchmark: $0.061 vs $0.401. MiMo-V2.5 (medium) быстрее: 27.11s vs 72.57s, с долей успешных попыток 69.8% vs 69.8%.

Рекомендуемая модель: MiMo-V2.5 (medium) - Здесь у него лучший балл (6.7), при этом он примерно в 6.6 раза дешевле, чем Qwen3.5-35B-A3B (medium).

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-10

Метрика	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Релиз: 2026-02-24	MiMo-V2.5 MiMo-V2.5 medium Релиз: 2026-04-22

Метрика	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Релиз: 2026-02-24	MiMo-V2.5 MiMo-V2.5 medium Релиз: 2026-04-22
Оценка	6.3	6.7
Ранг	#104	#90
Надежность	10.0	10.0
Стабильность	7.5	8.1
Тестов верно
Доля успешных попыток	69.8%	69.8%
Нестабильные тесты	6	5
Всего запусков	63	63
Стоимость за результат	5.162	2.966
Общая стоимость	$0.401	$0.061
Цена входа	$0.140 / 1M	$0.105 / 1M
Цена выхода	$1.000 / 1M	$0.280 / 1M
Общее число входных токенов	42,196	41,838
Выходные токены	40,630	2,827
Токены рассуждений	353,577	198,898
Время ответа (среднее)	72.57s	27.11s
Время ответа (макс.)	409.98s	162.44s
Время ответа (суммарно)	1524.04s	569.38s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#104 Qwen3.5-35B-A3B

medium

Стоимость: $0.009
Время: 71.4s
Токены: 8,631 tok

#90 MiMo-V2.5

medium

Стоимость: $0.002
Время: 54.8s
Токены: 5,247 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.13s	672	798	42,652
MiMo-V2.5	10.0	10.0	100.0%	0		4.14s	621	281	1,739

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	5.9	9.3	33.3%	0		206.65s	4,106	23,844	111,462
MiMo-V2.5	6.2	4.7	66.7%	2		97.14s	7,422	557	81,977

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	4.7	1.6	66.7%	1		75.34s	20,992	775	12,485
MiMo-V2.5	10.0	10.0	100.0%	0		16.86s	15,060	363	7,609

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	7.3	5.9	83.3%	1		59.33s	6,061	235	19,493
MiMo-V2.5	2.7	5.7	16.7%	1		6.33s	7,746	306	5,714

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	4.1	4.4	44.5%	2		88.34s	500	41	46,368
MiMo-V2.5	5.3	10.0	33.3%	0		34.53s	735	507	49,478

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	2.8	1.6	33.3%	1		30.30s	172	20	3,753
MiMo-V2.5	5.4	2.5	66.7%	1		5.37s	492	121	418

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	699	97	17,361
MiMo-V2.5	9.9	10.0	100.0%	0		1.80s	672	88	801

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	8.2	7.2	88.9%	1		33.13s	597	3,592	26,585
MiMo-V2.5	8.2	7.2	88.9%	1		20.25s	660	279	33,254

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	8,193	309	1,365
MiMo-V2.5	10.0	10.0	100.0%	0		7.29s	8,220	303	2,424

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	3.0	10.0	0.0%	0		177.35s	204	10,919	72,053
MiMo-V2.5	3.0	10.0	0.0%	0		51.29s	210	22	15,484

Быстрое сравнение

Сменить пару сравнения