AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs OpenAI: GPT-5.5

Сводка

Сравнение benchmark DeepSeek V3.2 vs GPT-5.5: DeepSeek V3.2 лидирует по среднему баллу: 7.5 vs 6.3. DeepSeek V3.2 имеет более низкую стоимость benchmark: $0.044 vs $0.231. GPT-5.5 быстрее: 1.89s vs 68.71s, с долей успешных попыток 65.1% vs 54.0%.

Рекомендуемая модель: DeepSeek V3.2 - Здесь у него лучший балл (7.5), при этом он примерно в 5.2 раза дешевле, чем GPT-5.5.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-18

Метрика	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01	GPT-5.5 GPT-5.5 none Релиз: 2026-04-24

Метрика	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01	GPT-5.5 GPT-5.5 none Релиз: 2026-04-24
Оценка	7.5	6.3
Ранг	#48	#90
Надежность	10.0	10.0
Стабильность	7.6	8.8
Тестов верно
Доля успешных попыток	65.1%	54.0%
Нестабильные тесты	6	3
Всего запусков	63	63
Стоимость за результат	0.436	2.302
Общая стоимость	$0.044	$0.231
Цена входа	$0.229 / 1M	$5.000 / 1M
Цена выхода	$0.344 / 1M	$30.000 / 1M
Общее число входных токенов	38,333	34,212
Выходные токены	7,186	1,971
Токены рассуждений	99,081	0
Время ответа (среднее)	68.71s	1.89s
Время ответа (макс.)	376.10s	5.56s
Время ответа (суммарно)	1442.81s	39.64s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#48 DeepSeek V3.2

medium

Стоимость: $0.001
Время: 53.6s
Токены: 1,932 tok

#90 GPT-5.5

none

Стоимость: $0.090
Время: 54.3s
Токены: 3,063 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	8.2	7.9	83.3%	1		24.23s	448	3,247	6,953
GPT-5.5	6.9	7.9	66.7%	1		1.31s	606	213	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.0	7.2	55.6%	1		248.68s	5,717	649	52,014
GPT-5.5	5.5	10.0	33.3%	0		1.35s	7,305	462	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		93.11s	14,283	571	6,296
GPT-5.5	3.0	10.0	0.0%	0		5.56s	11,019	300	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		36.09s	7,388	207	7,693
GPT-5.5	10.0	10.0	100.0%	0		1.18s	7,140	222	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	2.9	4.4	22.2%	2		24.27s	472	21	6,838
GPT-5.5	2.9	7.2	11.1%	1		1.31s	723	52	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.4	2.5	33.3%	1		58.29s	314	49	2,189
GPT-5.5	10.0	10.0	100.0%	0		3.41s	477	124	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		35.78s	627	1,397	2,845
GPT-5.5	6.2	5.8	66.7%	1		1.15s	660	81	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.0	7.2	55.6%	1		37.69s	594	518	6,375
GPT-5.5	7.7	10.0	66.7%	0		1.29s	642	252	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		34.81s	8,307	507	859
GPT-5.5	10.0	10.0	100.0%	0		3.90s	5,445	247	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		83.99s	183	20	7,019
GPT-5.5	3.0	10.0	0.0%	0		5.01s	195	18	0

Быстрое сравнение

Сменить пару сравнения

GPT-5.5nonevsQwen3.5-35B-A3Bmedium Gemma 4 31BmediumБесплатно доступноvsGPT-5.5none Nemotron 3 SupermediumБесплатно доступноvsGPT-5.5none DeepSeek V3.2mediumvsGPT-5.3 Chatnone DeepSeek V3.2mediumvsGemini 3 Flash Previewlow Gemini 3.1 Flash LiteminimalvsGPT-5.5none Claude Sonnet 4.6nonevsDeepSeek V3.2medium Gemini 3.1 Flash LitelowvsGPT-5.5none Gemini 3.1 Flash Lite PreviewlowvsGPT-5.5none Claude Opus 4.8nonevsDeepSeek V3.2medium DeepSeek V3.2mediumvsStep 3.7 Flashlow DeepSeek V3.2mediumvsQwen3.7 Plusnone