AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Qwen: Qwen3 Coder Next

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-19

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	Qwen3 Coder Next Qwen3 Coder Next none Релиз: 2026-02-03

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	Qwen3 Coder Next Qwen3 Coder Next none Релиз: 2026-02-03
Оценка	5.7	5.2
Ранг	#111	#128
Надежность	10.0	10.0
Стабильность	7.9	9.7
Тестов верно
Доля успешных попыток	49.1%	29.8%
Нестабильные тесты	5	1
Всего запусков	57	57
Стоимость за результат	0.218	0.151
Общая стоимость	$0.016	$0.008
???? ?????	$0.252 / 1M	$0.110 / 1M
???? ??????	$0.378 / 1M	$0.800 / 1M
Выходные токены	7,194	3,629
Токены рассуждений	0	0
Время ответа (среднее)	13.43s	9.44s
Время ответа (макс.)	115.89s	45.14s
Время ответа (суммарно)	255.10s	122.73s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.3	8.2	12.5%	1		9.35s	1,073	0
Qwen3 Coder Next	3.6	10.0	0.0%	0		3.31s	1,321	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	2.4	1.3	33.3%	1		7.63s	553	0
Qwen3 Coder Next	7.3	3.7	66.7%	1		3.14s	585	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		45.14s	317	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
Qwen3 Coder Next	6.5	10.0	50.0%	0		1.32s	246	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	6.9	16.7%	1		4.17s	21	0
Qwen3 Coder Next	5.3	10.0	33.3%	0		962ms	26	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.6	10.0	100.0%	0		9.32s	43	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	152	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
Qwen3 Coder Next	6.3	10.0	50.0%	0		7.71s	63	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.5	7.7	88.9%	1		7.13s	302	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		22.86s	652	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	255	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	17	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		601ms	12	0

Быстрое сравнение

Сменить пару сравнения

MiniMax M2.7mediumvsQwen3 Coder Nextnone DeepSeek V3.2nonevsgpt-oss-120bmediumБесплатно доступно DeepSeek V3.2nonevsMiniMax M2.5mediumБесплатно доступно DeepSeek V3.2nonevsMistral Small 4medium DeepSeek V3.2nonevsElephant Alphamedium CobuddymediumБесплатно доступноvsDeepSeek V3.2none Elephant AlphamediumvsQwen3 Coder Nextnone DeepSeek V3.2nonevsOwl Alphamedium Mistral Small 4mediumvsQwen3 Coder Nextnone MiniMax M2.5mediumБесплатно доступноvsQwen3 Coder Nextnone DeepSeek V3.2nonevsNemotron 3 SupermediumБесплатно доступно DeepSeek V3.2nonevsMiniMax M2.7medium