AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs OpenAI: GPT-5.4 Nano

Сводка

Средний балл практически равен: 7.5 vs 7.5. DeepSeek V3.2 (medium) имеет более низкую стоимость benchmark: $0.052 vs $0.107. GPT-5.4 Nano (medium) быстрее: 11.95s vs 68.71s, с долей успешных попыток 65.1% vs 63.5%.

Рекомендуемая модельGPT-5.4 Nano (medium)Здесь у него лучший балл (7.5), и он отвечает примерно в 5.7 раза быстрее, чем DeepSeek V3.2 (medium).

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-16

Метрика	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01	GPT-5.4 Nano GPT-5.4 Nano medium Релиз: 2026-03-17

Метрика	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01	GPT-5.4 Nano GPT-5.4 Nano medium Релиз: 2026-03-17
Оценка	7.5	7.5
Ранг	#68	#66
Надежность	10.0	10.0
Стабильность	7.6	8.4
Тестов верно
Доля успешных попыток	65.1%	63.5%
Нестабильные тесты	6	4
Всего запусков	63	63
Стоимость за результат	0.436	0.969
Общая стоимость	$0.052	$0.107
Цена входа	$0.269 / 1M	$0.200 / 1M
Цена выхода	$0.400 / 1M	$1.250 / 1M
Общее число входных токенов	38,333	35,434
Выходные токены	7,186	3,014
Токены рассуждений	99,081	76,520
Время ответа (среднее)	68.71s	11.95s
Время ответа (макс.)	376.10s	94.06s
Время ответа (суммарно)	1442.81s	250.98s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#68 DeepSeek V3.2

medium

Стоимость: $0.001
Время: 53.6s
Токены: 1,932 tok

#66 GPT-5.4 Nano

medium

Стоимость: $0.007
Время: 24.6s
Токены: 4,943 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	8.2	7.9	83.3%	1		24.23s	448	3,247	6,953
GPT-5.4 Nano	8.3	10.0	75.0%	0		4.52s	606	683	2,254

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.0	7.2	55.6%	1		248.68s	5,717	649	52,014
GPT-5.4 Nano	6.1	4.7	66.7%	2		19.12s	7,305	516	20,778

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		93.11s	14,283	571	6,296
GPT-5.4 Nano	9.8	10.0	100.0%	0		24.13s	12,345	349	5,719

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		36.09s	7,388	207	7,693
GPT-5.4 Nano	10.0	10.0	100.0%	0		2.54s	7,140	234	516

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	2.9	4.4	22.2%	2		24.27s	472	21	6,838
GPT-5.4 Nano	5.9	7.2	55.6%	1		38.18s	619	60	43,325

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.4	2.5	33.3%	1		58.29s	314	49	2,189
GPT-5.4 Nano	4.5	10.0	0.0%	0		4.15s	477	179	443

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		35.78s	627	1,397	2,845
GPT-5.4 Nano	9.8	10.0	100.0%	0		1.88s	660	95	521

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.0	7.2	55.6%	1		37.69s	594	518	6,375
GPT-5.4 Nano	4.1	7.2	22.2%	1		3.79s	642	594	1,408

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		34.81s	8,307	507	859
GPT-5.4 Nano	10.0	10.0	100.0%	0		7.71s	5,445	234	382

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		83.99s	183	20	7,019
GPT-5.4 Nano	3.0	10.0	0.0%	0		4.81s	195	70	1,174

Быстрое сравнение

Сменить пару сравнения

DeepSeek V3.2mediumvsGPT-5.3 Chatnone DeepSeek V3.2mediumvsGemini 3 Flash Previewlow DeepSeek V4 ProhighvsGPT-5.4 Nanomedium Gemini 3 Flash PreviewlowvsGPT-5.4 Nanomedium Claude Sonnet 4.6nonevsDeepSeek V3.2medium KAT-Coder-Pro V2.5highvsGPT-5.4 Nanomedium GPT-5.4 NanomediumvsStep 3.7 Flashlow Claude Sonnet 4.6nonevsGPT-5.4 Nanomedium DeepSeek V3.2mediumvsKAT-Coder-Pro V2.5high Claude Opus 4.8lowvsGPT-5.4 Nanomedium Claude Opus 4.8nonevsDeepSeek V3.2medium DeepSeek V3.2mediumvsGPT-5.6 Lunahigh