AI BENCHY Compare

Mistral: Mistral Small 4 vs Qwen: Qwen3 Coder Next

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-04

Метрика	Mistral Small 4 Mistral Small 4 none Релиз: 2026-03-16	Qwen3 Coder Next Qwen3 Coder Next none Релиз: 2026-02-03

Метрика	Mistral Small 4 Mistral Small 4 none Релиз: 2026-03-16	Qwen3 Coder Next Qwen3 Coder Next none Релиз: 2026-02-03
Оценка	5.3	5.0
Ранг	#75	#79
Стабильность	9.5	10.0
Тестов верно
Доля успешных попыток	33.3%	23.5%
Нестабильные тесты	1	0
Всего запусков	51	51
Стоимость за результат	0.108	0.175
Общая стоимость	$0.006	$0.007
???? ?????	$0.150 / 1M	$0.120 / 1M
???? ??????	$0.600 / 1M	$0.750 / 1M
Выходные токены	1,624	3,032
Токены рассуждений	0	0
Время ответа (среднее)	629ms	10.82s
Время ответа (макс.)	1.72s	45.14s
Время ответа (суммарно)	10.70s	118.99s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	3.4	7.9	16.7%	1		395ms	182	0
Qwen3 Coder Next	3.6	10.0	0.0%	0		3.31s	1,321	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	3.0	10.0	0.0%	0		1.72s	496	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		45.14s	317	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	10.0	10.0	100.0%	0		822ms	261	0
Qwen3 Coder Next	6.5	10.0	50.0%	0		1.32s	246	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	5.3	10.0	33.3%	0		367ms	28	0
Qwen3 Coder Next	5.3	10.0	33.3%	0		962ms	26	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	4.0	10.0	0.0%	0		729ms	205	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	152	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	6.5	10.0	50.0%	0		380ms	69	0
Qwen3 Coder Next	4.8	10.0	0.0%	0		7.71s	63	0

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	3.1	9.9	0.0%	0		589ms	170	0
Qwen3 Coder Next	3.2	10.0	0.0%	0		22.86s	652	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Mistral Small 4	10.0	10.0	100.0%	0		1.40s	213	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	255	0

Быстрое сравнение

Сменить пару сравнения

MiniMax M2.7mediumvsQwen3 Coder Nextnone MiniMax M2.7mediumvsMistral Small 4none Qwen3 Coder NextnonevsGLM 4.7 Flashmedium Mistral Small 4nonevsQwen3 Coder Nextmedium Mistral Small 4nonevsGLM 4.7 Flashmedium Mistral Small 4mediumvsQwen3 Coder Nextnone MiniMax M2.5mediumБесплатно доступноvsMistral Small 4none Mistral Small 4nonevsgpt-oss-120bmediumБесплатно доступно Mistral Small 4nonevsQwen3.5-9Bmedium MiniMax M2.5mediumБесплатно доступноvsQwen3 Coder Nextnone Mistral Small 4nonevsGrok 4.20 Multi Agent Betamedium gpt-oss-120bmediumБесплатно доступноvsQwen3 Coder Nextnone