AI BENCHY Compare

Mistral: Mistral Small 4 vs Qwen: Qwen3.5-122B-A10B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-17

Метрика	Mistral Small 4 Mistral Small 4 medium Релиз: 2026-03-16	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Релиз: 2026-02-24

Метрика	Mistral Small 4 Mistral Small 4 medium Релиз: 2026-03-16	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Релиз: 2026-02-24
Ранг	#55	#52
Оценка	5.6	5.8
Стабильность	7.0	9.6
Стоимость за результат	0.502	0.333
Общая стоимость	$0.026	$0.020
Тестов верно
Доля успешных попыток	49.0%	37.3%
Нестабильные тесты	6	1
Всего запусков	51	51
Выходные токены	12,288	2,682
Токены рассуждений	28,112	0
Время ответа (среднее)	4.18s	3.71s
Время ответа (макс.)	25.25s	46.00s
Время ответа (суммарно)	71.03s	63.06s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	5.6	3.8	66.7%	3		2.67s	4,055	4,778
Qwen3.5-122B-A10B	4.8	10.0	25.0%	0		1.59s	312	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	3.0	10.0	0.0%	0		25.25s	2,612	10,700
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		46.00s	1,137	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	7.3	5.9	83.3%	1		1.23s	335	723
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		1.01s	243	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	5.3	7.2	44.4%	1		6.11s	2,621	6,904
Qwen3.5-122B-A10B	5.3	10.0	33.3%	0		465ms	15	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	4.8	10.0	0.0%	0		2.05s	821	828
Qwen3.5-122B-A10B	5.0	10.0	0.0%	0		1.12s	66	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	7.3	5.8	83.3%	1		1.38s	540	1,031
Qwen3.5-122B-A10B	4.5	6.8	16.7%	1		585ms	70	0

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	3.4	9.7	0.0%	0		2.00s	983	2,338
Qwen3.5-122B-A10B	5.4	10.0	33.3%	0		982ms	575	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	10.0	10.0	100.0%	0		3.50s	321	810
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		2.04s	264	0

Быстрое сравнение

Сменить пару сравнения

Mistral Small 4mediumvsGLM 5 Turbonone Mistral Small 4mediumvsGLM 4.7 Flashnone Mistral Small 4mediumvsQwen3.5-27Bnone Mistral Small 4mediumvsGPT-5.4none MiniMax M2.5mediumБесплатно доступноvsQwen3.5-122B-A10Bnone gpt-oss-120bmediumБесплатно доступноvsQwen3.5-122B-A10Bnone Mistral Small 4mediumvsGrok 4.20 Betanone Mistral Small 4mediumvsKimi K2.5none Mistral Small 4mediumvsHunter Alphanone Trinity Large PreviewnoneБесплатно доступноvsMistral Small 4medium Mistral Small 4mediumvsQwen3.5-35B-A3Bnone Gemini 2.5 FlashnonevsMistral Small 4medium