DeepSeek V4 Flash (high) vs GPT-5.2 (medium)

GPT-5.2 (medium) лидирует по среднему баллу: 8.4 vs 7.7. DeepSeek V4 Flash (high) имеет более низкую стоимость benchmark: $0.041 vs $0.951. GPT-5.2 (medium) быстрее: 22.62s vs 49.75s, с долей успешных попыток 72.7% vs 72.7%.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Ранг: #52
Общее число выходных токенов: 168,165
Время ответа (среднее): 49.75s
Общая стоимость: $0.041

Ранг: #27
Общее число выходных токенов: 54,782
Время ответа (среднее): 22.62s
Общая стоимость: $0.951

Рекомендуемая модель DeepSeek V4 Flash (high)

Его балл близок к лучшему здесь (7.7 против 8.4), при этом он примерно в 23.7 раза дешевле, чем GPT-5.2 (medium).

Подробное сравнение

Метрика	DeepSeek V4 Flash DeepSeek V4 Flash high Релиз: 2026-04-24	GPT-5.2 GPT-5.2 medium Релиз: 2025-12-11

Метрика	DeepSeek V4 Flash DeepSeek V4 Flash high Релиз: 2026-04-24	GPT-5.2 GPT-5.2 medium Релиз: 2025-12-11
Оценка	7.7	8.4
Ранг	#52	#27
Надежность	10.0	10.0
Стабильность	8.2	8.5
Тестов верно
Доля успешных попыток	72.7%	72.7%
Нестабильные тесты	5	4
Всего запусков	66	66
Стоимость за результат	0.402	6.791
Общая стоимость	$0.041	$0.951
Цена входа	$0.094 / 1M	$1.750 / 1M
Цена выхода	$0.188 / 1M	$14.000 / 1M
Общее число входных токенов	108,392	105,004
Выходные токены	14,478	9,914
Токены рассуждений	153,687	44,868
Время ответа (среднее)	49.75s	22.62s
Время ответа (макс.)	218.13s	102.93s
Время ответа (суммарно)	1094.41s	339.28s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#52 DeepSeek V4 Flash

high

Стоимость: $0.003
Время: 93.1s
Токены: 7,926 tok

#27 GPT-5.2

medium

Стоимость: $0.047
Время: 49.2s
Токены: 3,396 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	540	140	7,770
GPT-5.2	6.5	8.0	58.3%	1		7.81s	606	567	2,002

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	7.8	10.0	66.7%	0		50.60s	7,279	395	34,862
GPT-5.2	10.0	10.0	100.0%	0		22.73s	7,302	511	11,912

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	6.4	5.8	66.7%	1		104.10s	82,663	4,633	37,533
GPT-5.2	10.0	10.0	100.0%	0		58.50s	82,056	7,304	14,693

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	7,290	201	1,179
GPT-5.2	10.0	10.0	100.0%	0		3.15s	7,140	234	420

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	4.1	4.4	44.5%	2		100.31s	666	27	59,249
GPT-5.2	5.9	7.2	55.6%	1		77.80s	473	42	10,342

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	471	79	632
GPT-5.2	3.7	9.7	0.0%	0		4.32s	477	162	269

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	627	63	1,622
GPT-5.2	9.9	10.0	100.0%	0		3.12s	660	94	614

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	8.2	7.2	88.9%	1		26.11s	594	196	1,767
GPT-5.2	7.5	7.3	77.8%	1		5.80s	642	735	924

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	8,079	228	542
GPT-5.2	4.7	1.6	66.7%	1		10.30s	5,453	239	469

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	3.0	10.0	0.0%	0		54.46s	183	8,516	8,531
GPT-5.2	3.0	10.0	0.0%	0		28.18s	195	26	3,223

Быстрое сравнение

Сменить пару сравнения