AI BENCHY Compare

Mistral: Mistral Small 4 vs Laguna M.1

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-29

Метрика	Mistral Small 4 Mistral Small 4 none Релиз: 2026-03-16	Laguna M.1 Laguna M.1 none Релиз: 2026-04-28 Бесплатно доступно

Метрика	Mistral Small 4 Mistral Small 4 none Релиз: 2026-03-16	Laguna M.1 Laguna M.1 none Релиз: 2026-04-28 Бесплатно доступно
Оценка	5.2	5.1
Ранг	#109	#117
Надежность	Н/Д	9.9
Стабильность	9.5	8.7
Тестов верно
Доля успешных попыток	31.5%	33.3%
Нестабильные тесты	1	3
Всего запусков	54	54
Стоимость за результат	0.118	0.000
Общая стоимость	$0.006	$0.000
???? ?????	$0.150 / 1M	$0.000 / 1M
???? ??????	$0.600 / 1M	$0.000 / 1M
Выходные токены	2,207	2,870
Токены рассуждений	0	0
Время ответа (среднее)	665ms	2.79s
Время ответа (макс.)	1.72s	15.42s
Время ответа (суммарно)	11.97s	50.24s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	3.4	7.9	16.7%	1		395ms	182	0
Laguna M.1	3.4	7.9	16.7%	1		1.23s	485	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	4.5	9.0	0.0%	0		1.28s	583	0
Laguna M.1	7.5	3.8	66.7%	1		2.93s	543	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	3.0	10.0	0.0%	0		1.72s	496	0
Laguna M.1	3.0	10.0	0.0%	0		4.32s	622	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	10.0	10.0	100.0%	0		822ms	261	0
Laguna M.1	10.0	10.0	100.0%	0		3.37s	246	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	5.3	10.0	33.3%	0		367ms	28	0
Laguna M.1	3.6	7.2	22.2%	1		5.50s	33	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	4.0	10.0	0.0%	0		729ms	205	0
Laguna M.1	4.0	10.0	0.0%	0		3.08s	212	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	6.5	10.0	50.0%	0		380ms	69	0
Laguna M.1	6.3	10.0	50.0%	0		683ms	80	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	3.1	9.9	0.0%	0		589ms	170	0
Laguna M.1	3.2	10.0	0.0%	0		951ms	340	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	10.0	10.0	100.0%	0		1.40s	213	0
Laguna M.1	10.0	10.0	100.0%	0		7.54s	309	0

Быстрое сравнение

Сменить пару сравнения

Mistral Small 4nonevsNemotron 3 Nano Omni 30b A3b ReasoningmediumБесплатно доступно Mistral Small 4nonevsElephant Alphamedium MiniMax M2.7mediumvsMistral Small 4none Nemotron 3 Nano Omni 30b A3b ReasoningmediumБесплатно доступноvsLaguna M.1noneБесплатно доступно Elephant AlphamediumvsLaguna M.1noneБесплатно доступно MiniMax M2.7mediumvsLaguna M.1noneБесплатно доступно Laguna M.1noneБесплатно доступноvsQwen3 Coder Nextmedium Laguna M.1noneБесплатно доступноvsGLM 4.7 Flashmedium MiniMax M2.5mediumБесплатно доступноvsMistral Small 4none Mistral Small 4nonevsQwen3 Coder Nextmedium Mistral Small 4mediumvsLaguna M.1noneБесплатно доступно Mistral Small 4nonevsGLM 4.7 Flashmedium