AI BENCHY Compare

Mistral: Mistral Small 4 vs Xiaomi: MiMo-V2.5-Pro

Сводка

Сравнение benchmark Mistral Small 4 vs MiMo-V2.5-Pro: MiMo-V2.5-Pro лидирует по среднему баллу: 5.5 vs 5.3. MiMo-V2.5-Pro имеет более низкую стоимость benchmark: $0.017 vs $0.068. MiMo-V2.5-Pro быстрее: 1.78s vs 9.40s, с долей успешных попыток 44.4% vs 39.7%.

Рекомендуемая модель: MiMo-V2.5-Pro - Здесь у него лучший балл (5.5), при этом он примерно в 4.2 раза дешевле, чем Mistral Small 4.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-04

Метрика	Mistral Small 4 Mistral Small 4 medium Релиз: 2026-03-16	MiMo-V2.5-Pro MiMo-V2.5-Pro none Релиз: 2026-04-22

Метрика	Mistral Small 4 Mistral Small 4 medium Релиз: 2026-03-16	MiMo-V2.5-Pro MiMo-V2.5-Pro none Релиз: 2026-04-22
Оценка	5.3	5.5
Ранг	#132	#123
Надежность	10.0	10.0
Стабильность	6.9	8.6
Тестов верно
Доля успешных попыток	44.4%	39.7%
Нестабильные тесты	8	4
Всего запусков	63	63
Стоимость за результат	1.344	0.648
Общая стоимость	$0.068	$0.017
Цена входа	$0.150 / 1M	$0.435 / 1M
Цена выхода	$0.600 / 1M	$0.870 / 1M
Общее число входных токенов	42,576	30,724
Выходные токены	24,184	3,043
Токены рассуждений	84,678	0
Время ответа (среднее)	9.40s	1.78s
Время ответа (макс.)	59.15s	8.32s
Время ответа (суммарно)	197.39s	37.42s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#132 Mistral Small 4

medium

Cost: $0.006
Time: 47.9s
Tokens: 9,857 tok

#123 MiMo-V2.5-Pro

none

Cost: $0.004
Time: 46.4s
Tokens: 4,025 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	5.6	3.8	66.7%	3		2.67s	708	4,055	4,778
MiMo-V2.5-Pro	3.3	8.1	8.3%	1		2.67s	645	994	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	4.4	5.1	33.3%	2		39.98s	7,636	11,635	54,715
MiMo-V2.5-Pro	4.3	7.8	22.2%	1		1.41s	6,559	485	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	3.0	10.0	0.0%	0		25.25s	18,706	2,612	10,700
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		3.54s	4,695	596	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	7.3	5.9	83.3%	1		1.23s	6,171	335	723
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		1.32s	7,758	249	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	5.3	7.2	44.4%	1		6.11s	742	2,621	6,904
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		877ms	753	27	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	4.8	10.0	0.0%	0		2.05s	519	821	828
MiMo-V2.5-Pro	4.0	10.0	0.0%	0		2.58s	498	87	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	7.3	5.8	83.3%	1		1.38s	729	540	1,031
MiMo-V2.5-Pro	6.4	10.0	50.0%	0		1.03s	684	66	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	3.4	9.7	0.0%	0		2.17s	735	1,226	2,632
MiMo-V2.5-Pro	6.7	4.7	77.8%	2		1.30s	678	267	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	10.0	10.0	100.0%	0		3.50s	6,420	321	810
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.30s	8,238	258	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	3.0	10.0	0.0%	0		5.92s	210	18	1,557
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		1.89s	216	14	0

Быстрое сравнение

Сменить пару сравнения

Mistral Small 4mediumvsQwen3.5-122B-A10Bnone DeepSeek V3.2nonevsMistral Small 4medium Mistral Small 4mediumvsGLM 5 Turbonone Mistral Small 4mediumvsKimi K2.5none Mistral Small 4mediumvsQwen3.6 Flashnone CobuddymediumvsMiMo-V2.5-Pronone Mistral Small 4mediumvsGrok 4.20none Mistral Small 4mediumvsgpt-oss-120bnoneБесплатно доступно MiniMax M2.5mediumvsMiMo-V2.5-Pronone Mistral Small 4mediumvsGPT-5.4none Mistral Small 4mediumvsKimi K2.6noneБесплатно доступно MiniMax M2.7mediumvsMiMo-V2.5-Pronone