DeepSeek V3.2 (medium) vs Qwen3.7 Plus

Qwen3.7 Plus лидирует по среднему баллу: 7.2 vs 7.0. DeepSeek V3.2 (medium) имеет более низкую стоимость benchmark: $0.078 vs $0.106. Qwen3.7 Plus быстрее: 12.09s vs 68.62s, с долей успешных попыток 65.2% vs 50.0%.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-28

Ранг: #86
Общее число выходных токенов: 128,848
Время ответа (среднее): 68.62s
Общая стоимость: $0.078

Ранг: #81
Общее число выходных токенов: 58,097
Время ответа (среднее): 12.09s
Общая стоимость: $0.106

Рекомендуемая модель Qwen3.7 Plus

Здесь у него лучший балл (7.2), и он отвечает примерно в 5.7 раза быстрее, чем DeepSeek V3.2 (medium).

Подробное сравнение

Метрика	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01	Qwen3.7 Plus Qwen3.7 Plus none Релиз: 2026-06-03

Метрика	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01	Qwen3.7 Plus Qwen3.7 Plus none Релиз: 2026-06-03
Оценка	7.0	7.2
Ранг	#86	#81
Надежность	10.0	10.0
Стабильность	7.4	10.0
Тестов верно
Доля успешных попыток	65.2%	50.0%
Нестабильные тесты	7	0
Всего запусков	66	66
Стоимость за результат	0.671	1.014
Общая стоимость	$0.078	$0.106
Цена входа	$0.269 / 1M	$0.320 / 1M
Цена выхода	$0.400 / 1M	$1.280 / 1M
Общее число входных токенов	101,047	98,824
Выходные токены	11,834	58,097
Токены рассуждений	117,014	0
Время ответа (среднее)	68.62s	12.09s
Время ответа (макс.)	376.10s	206.03s
Время ответа (суммарно)	1509.53s	265.89s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#86 DeepSeek V3.2

medium

Стоимость: $0.001
Время: 53.6s
Токены: 1,932 tok

#81 Qwen3.7 Plus

none

Стоимость: $0.019
Время: 213.5s
Токены: 11,960 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	8.2	7.9	83.3%	1		24.23s	448	3,247	6,953
Qwen3.7 Plus	6.5	10.0	50.0%	0		1.38s	696	349	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.0	7.2	55.6%	1		248.68s	5,717	649	52,014
Qwen3.7 Plus	5.5	10.0	33.3%	0		2.15s	7,911	639	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.3	5.8	83.3%	1		79.92s	76,997	5,219	24,229
Qwen3.7 Plus	10.0	10.0	100.0%	0		117.70s	71,266	56,024	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		36.09s	7,388	207	7,693
Qwen3.7 Plus	10.0	10.0	100.0%	0		1.43s	7,794	243	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	2.9	4.4	22.2%	2		24.27s	472	21	6,838
Qwen3.7 Plus	3.0	10.0	0.0%	0		868ms	789	18	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.4	2.5	33.3%	1		58.29s	314	49	2,189
Qwen3.7 Plus	5.3	10.0	0.0%	0		1.33s	522	78	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		35.78s	627	1,397	2,845
Qwen3.7 Plus	6.3	10.0	50.0%	0		929ms	711	72	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.0	7.2	55.6%	1		37.69s	594	518	6,375
Qwen3.7 Plus	7.7	10.0	66.7%	0		1.71s	714	443	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		34.81s	8,307	507	859
Qwen3.7 Plus	10.0	10.0	100.0%	0		3.54s	8,211	222	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		83.99s	183	20	7,019
Qwen3.7 Plus	3.0	10.0	0.0%	0		1.21s	210	9	0

Быстрое сравнение

Сменить пару сравнения

DeepSeek V3.2mediumvsGemini 3.5 Flashnone Qwen3.7 PlusnonevsGrok 4.3medium Qwen3.7 PlusnonevsGLM 5.1medium Qwen3.7 PlusnonevsGrok 4.20medium KAT-Coder-Pro V2.5highvsQwen3.7 Plusnone Kimi K2.6mediumvsQwen3.7 Plusnone Qwen3.7 PlusnonevsStep 3.7 Flashlow DeepSeek V3.2mediumvsGPT-5.6 Solnone Gemini 3.1 Flash LitemediumvsQwen3.7 Plusnone DeepSeek V3.2mediumvsStep 3.7 Flashhigh Gemini 3.1 Flash Lite PreviewmediumvsQwen3.7 Plusnone DeepSeek V3.2mediumvsGPT-5.5none