AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs OpenAI: GPT-5 Mini

Сводка

Сравнение benchmark DeepSeek V4 Pro vs GPT-5 Mini: GPT-5 Mini лидирует по среднему баллу: 8.5 vs 8.1. DeepSeek V4 Pro имеет более низкую стоимость benchmark: $0.098 vs $0.159. GPT-5 Mini быстрее: 23.64s vs 72.22s, с долей успешных попыток 66.7% vs 63.5%.

Рекомендуемая модель: GPT-5 Mini - Здесь у него лучший балл (8.5), и он отвечает примерно в 3.1 раза быстрее, чем DeepSeek V4 Pro.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-12

Метрика	DeepSeek V4 Pro DeepSeek V4 Pro high Релиз: 2026-04-24	GPT-5 Mini GPT-5 Mini medium Релиз: 2025-08-07

Метрика	DeepSeek V4 Pro DeepSeek V4 Pro high Релиз: 2026-04-24	GPT-5 Mini GPT-5 Mini medium Релиз: 2025-08-07
Оценка	8.1	8.5
Ранг	#30	#19
Надежность	9.6	10.0
Стабильность	7.8	9.1
Тестов верно
Доля успешных попыток	66.7%	63.5%
Нестабильные тесты	6	2
Всего запусков	57	63
Стоимость за результат	0.978	1.319
Общая стоимость	$0.098	$0.159
Цена входа	$0.435 / 1M	$0.250 / 1M
Цена выхода	$0.870 / 1M	$2.000 / 1M
Общее число входных токенов	35,122	37,100
Выходные токены	6,315	6,801
Токены рассуждений	93,205	67,690
Время ответа (среднее)	72.22s	23.64s
Время ответа (макс.)	437.44s	88.15s
Время ответа (суммарно)	1444.45s	496.44s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#30 DeepSeek V4 Pro

high

Cost: $0.023
Time: 257.6s
Tokens: 14,870 tok

#19 GPT-5 Mini

medium

Cost: $0.007
Time: 42.9s
Tokens: 3,432 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	5.7	5.9	58.3%	2		25.70s	536	149	3,214
GPT-5 Mini	7.1	7.6	66.7%	1		13.86s	606	1,715	6,378

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	7.7	10.0	66.7%	0		308.19s	1,583	368	42,658
GPT-5 Mini	10.0	10.0	100.0%	0		27.63s	7,302	658	17,152

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	10.0	10.0	100.0%	0		38.17s	14,060	454	5,836
GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	14,118	754	11,520

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	10.0	10.0	100.0%	0		25.03s	7,690	274	2,166
GPT-5 Mini	10.0	10.0	100.0%	0		12.58s	7,140	453	3,200

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	3.6	7.2	22.2%	1		130.09s	472	4,400	26,367
GPT-5 Mini	3.6	7.2	22.2%	1		44.63s	515	293	14,016

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	10.0	10.0	100.0%	0		8.83s	471	115	1,013
GPT-5 Mini	4.5	10.0	0.0%	0		13.50s	477	349	1,856

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	7.8	6.6	83.3%	1		8.73s	627	66	2,726
GPT-5 Mini	10.0	10.0	100.0%	0		11.59s	660	310	3,968

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	6.9	4.9	77.8%	2		56.85s	591	178	2,563
GPT-5 Mini	5.6	9.8	33.3%	0		15.20s	642	1,622	6,144

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	9.8	10.0	100.0%	0		15.92s	8,909	295	701
GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	5,445	487	1,600

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	3.0	10.0	0.0%	0		34.01s	183	16	5,961
GPT-5 Mini	3.0	10.0	0.0%	0		9.99s	195	160	1,856

Быстрое сравнение

Сменить пару сравнения