DeepSeek: DeepSeek V3.2 vs OpenAI: GPT-5.3 Chat

GPT-5.3 Chat лидирует по среднему баллу: 7.5 vs 7.0. DeepSeek V3.2 (medium) имеет более низкую стоимость benchmark: $0.078 vs $0.571. GPT-5.3 Chat быстрее: 6.88s vs 68.62s, с долей успешных попыток 65.2% vs 68.2%.

Рекомендуемая модельGPT-5.3 ChatЗдесь у него лучший балл (7.5), и он отвечает примерно в 10.0 раза быстрее, чем DeepSeek V3.2 (medium).

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Метрика	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01	GPT-5.3 Chat GPT-5.3 Chat none Релиз: 2026-03-03

Метрика	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01	GPT-5.3 Chat GPT-5.3 Chat none Релиз: 2026-03-03
Оценка	7.0	7.5
Ранг	#84	#62
Надежность	10.0	10.0
Стабильность	7.4	8.2
Тестов верно
Доля успешных попыток	65.2%	68.2%
Нестабильные тесты	7	5
Всего запусков	66	66
Стоимость за результат	0.671	4.387
Общая стоимость	$0.078	$0.571
Цена входа	$0.269 / 1M	$1.750 / 1M
Цена выхода	$0.400 / 1M	$14.000 / 1M
Общее число входных токенов	101,047	78,990
Выходные токены	11,834	30,854
Токены рассуждений	117,014	0
Время ответа (среднее)	68.62s	6.88s
Время ответа (макс.)	376.10s	18.33s
Время ответа (суммарно)	1509.53s	151.31s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#84 DeepSeek V3.2

medium

Стоимость: $0.001
Время: 53.6s
Токены: 1,932 tok

#62 GPT-5.3 Chat

none

Стоимость: $0.008
Время: 8.1s
Токены: 634 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	8.2	7.9	83.3%	1		24.23s	448	3,247	6,953
GPT-5.3 Chat	6.7	8.1	58.3%	1		3.86s	606	3,167	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.0	7.2	55.6%	1		248.68s	5,717	649	52,014
GPT-5.3 Chat	5.6	4.7	55.6%	2		10.52s	7,302	6,632	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.3	5.8	83.3%	1		79.92s	76,997	5,219	24,229
GPT-5.3 Chat	10.0	10.0	100.0%	0		15.07s	55,800	6,851	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		36.09s	7,388	207	7,693
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.21s	7,140	942	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	2.9	4.4	22.2%	2		24.27s	472	21	6,838
GPT-5.3 Chat	3.5	4.4	33.3%	2		13.01s	723	8,264	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.4	2.5	33.3%	1		58.29s	314	49	2,189
GPT-5.3 Chat	4.6	10.0	0.0%	0		1.99s	477	319	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		35.78s	627	1,397	2,845
GPT-5.3 Chat	9.8	10.0	100.0%	0		3.51s	660	1,491	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.0	7.2	55.6%	1		37.69s	594	518	6,375
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.99s	642	1,758	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		34.81s	8,307	507	859
GPT-5.3 Chat	10.0	10.0	100.0%	0		8.36s	5,445	861	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		83.99s	183	20	7,019
GPT-5.3 Chat	3.0	10.0	0.0%	0		4.38s	195	569	0

Быстрое сравнение

Сменить пару сравнения

Kimi K2.7 CodemediumvsGPT-5.3 Chatnone DeepSeek V3.2mediumvsGemini 3.5 Flashnone GPT-5.3 ChatnonevsQwen3.5 Plus 2026-02-15medium Nemotron 3 UltramediumБесплатно доступноvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsQwen3.5-27Bmedium GPT-5.3 ChatnonevsGrok Build 0.1medium LongCat 2.0mediumvsGPT-5.3 Chatnone MiniMax M3mediumvsGPT-5.3 Chatnone DeepSeek V3.2mediumvsGPT-5.6 Solnone Gemini 3 Flash PreviewlowvsGPT-5.3 Chatnone KAT-Coder-Pro V2.5lowvsGPT-5.3 Chatnone DeepSeek V3.2mediumvsQwen3.7 Plusnone