Mistral: Mistral Small 4 vs Qwen: Qwen3.5-9B

Mistral Small 4 лидирует по среднему баллу: 5.1 vs 5.1. Qwen3.5-9B имеет более низкую стоимость benchmark: $0.021 vs $0.022. Mistral Small 4 быстрее: 1.20s vs 19.17s, с долей успешных попыток 25.8% vs 19.7%.

Рекомендуемая модельMistral Small 4Здесь у него лучший балл (5.1), и он отвечает примерно в 16.0 раза быстрее, чем Qwen3.5-9B.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Метрика	Mistral Small 4 Mistral Small 4 none Релиз: 2026-03-16	Qwen3.5-9B Qwen3.5-9B none Релиз: 2026-03-02

Метрика	Mistral Small 4 Mistral Small 4 none Релиз: 2026-03-16	Qwen3.5-9B Qwen3.5-9B none Релиз: 2026-03-02
Оценка	5.1	5.1
Ранг	#179	#183
Надежность	10.0	10.0
Стабильность	9.6	9.7
Тестов верно
Доля успешных попыток	25.8%	19.7%
Нестабильные тесты	1	1
Всего запусков	66	66
Стоимость за результат	0.432	0.490
Общая стоимость	$0.022	$0.021
Цена входа	$0.150 / 1M	$0.100 / 1M
Цена выхода	$0.600 / 1M	$0.150 / 1M
Общее число входных токенов	104,708	144,407
Выходные токены	9,812	37,484
Токены рассуждений	0	0
Время ответа (среднее)	1.20s	19.17s
Время ответа (макс.)	13.16s	382.06s
Время ответа (суммарно)	26.38s	421.74s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#179 Mistral Small 4

none

Стоимость: $0.002
Время: 10.4s
Токены: 2,370 tok

#183 Qwen3.5-9B

none

Неверный SVG

Стоимость: $0.000
Время: 300.0s
Токены: 0 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	3.4	7.9	16.7%	1		395ms	708	182	0
Qwen3.5-9B	3.1	9.9	0.0%	0		1.71s	696	582	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	3.7	9.7	0.0%	0		901ms	7,636	619	0
Qwen3.5-9B	3.9	7.8	11.1%	1		5.60s	7,913	1,042	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	3.0	10.0	0.0%	0		7.44s	79,039	8,107	0
Qwen3.5-9B	3.0	10.0	0.0%	0		193.98s	116,763	34,787	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	10.0	10.0	100.0%	0		822ms	7,914	261	0
Qwen3.5-9B	10.0	10.0	100.0%	0		847ms	7,788	249	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	5.3	10.0	33.3%	0		367ms	798	28	0
Qwen3.5-9B	3.0	10.0	0.0%	0		464ms	789	24	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	4.0	10.0	0.0%	0		729ms	519	205	0
Qwen3.5-9B	4.4	9.9	0.0%	0		552ms	522	99	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	6.5	10.0	50.0%	0		380ms	729	69	0
Qwen3.5-9B	6.5	10.0	50.0%	0		514ms	711	75	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	3.1	9.9	0.0%	0		399ms	735	111	0
Qwen3.5-9B	3.2	10.0	0.0%	0		621ms	714	347	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	10.0	10.0	100.0%	0		1.40s	6,420	213	0
Qwen3.5-9B	10.0	10.0	100.0%	0		1.27s	8,301	273	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mistral Small 4	3.0	10.0	0.0%	0		397ms	210	17	0
Qwen3.5-9B	3.0	10.0	0.0%	0		2.32s	210	6	0

Быстрое сравнение

Сменить пару сравнения

Mistral Small 4mediumvsQwen3.5-9Bnone MiniMax M2.7mediumvsQwen3.5-9Bnone Laguna S 2.1lowБесплатно доступноvsQwen3.5-9Bnone MiniMax M2.7mediumvsMistral Small 4none Mistral Small 4nonevsLaguna S 2.1lowБесплатно доступно Mistral Small 4nonevsLaguna S 2.1highБесплатно доступно KAT-Coder-Air V2.5lowvsMistral Small 4none Mistral Small 4nonevsLaguna S 2.1mediumБесплатно доступно Laguna S 2.1highБесплатно доступноvsQwen3.5-9Bnone KAT-Coder-Air V2.5lowvsQwen3.5-9Bnone Laguna S 2.1mediumБесплатно доступноvsQwen3.5-9Bnone CobuddymediumvsQwen3.5-9Bnone