AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs OpenAI: GPT-5 Mini

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-24

Метрика	DeepSeek V4 Pro DeepSeek V4 Pro none Релиз: 2026-04-24	GPT-5 Mini GPT-5 Mini medium Релиз: 2025-08-07

Метрика	DeepSeek V4 Pro DeepSeek V4 Pro none Релиз: 2026-04-24	GPT-5 Mini GPT-5 Mini medium Релиз: 2025-08-07
Оценка	6.7	7.0
Ранг	#59	#52
Стабильность	9.5	8.6
Тестов верно
Доля успешных попыток	51.9%	61.1%
Нестабильные тесты	1	3
Всего запусков	26	54
Стоимость за результат	0.317	1.415
Общая стоимость	$0.029	$0.128
???? ?????	$1.740 / 1M	$0.250 / 1M
???? ??????	$3.480 / 1M	$2.000 / 1M
Выходные токены	1,596	6,379
Токены рассуждений	0	53,482
Время ответа (среднее)	24.23s	23.98s
Время ответа (макс.)	109.46s	88.15s
Время ответа (суммарно)	436.17s	431.56s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	4.8	10.0	25.0%	0		36.12s	221	0
GPT-5 Mini	7.1	7.6	66.7%	1		13.86s	1,715	6,378

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	10.0	10.0	100.0%	0		33.40s	246	0
GPT-5 Mini	10.0	10.0	100.0%	0		23.18s	483	4,160

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	9.5	10.0	100.0%	0		34.55s	826	0
GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	754	11,520

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	10.0	10.0	100.0%	0		54.04s	65	0
GPT-5 Mini	10.0	10.0	100.0%	0		12.58s	453	3,200

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	5.3	10.0	33.3%	0		3.74s	6	0
GPT-5 Mini	3.6	7.2	22.2%	1		44.63s	293	14,016

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	4.5	10.0	0.0%	0		6.06s	45	0
GPT-5 Mini	4.5	10.0	0.0%	0		13.50s	349	1,856

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	6.5	10.0	50.0%	0		3.57s	22	0
GPT-5 Mini	8.0	6.6	83.3%	1		15.66s	318	4,992

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	6.0	7.1	44.4%	1		28.25s	92	0
GPT-5 Mini	5.6	9.8	33.3%	0		14.09s	1,527	5,760

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	10.0	10.0	100.0%	0		6.47s	73	0
GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	487	1,600

Быстрое сравнение

Сменить пару сравнения

DeepSeek V4 PrononevsGrok 4.1 Fastmedium DeepSeek V4 PrononevsNemotron 3 SupermediumБесплатно доступно Gemma 4 31BnoneБесплатно доступноvsGPT-5 Minimedium DeepSeek V4 PrononevsMercury 2medium GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none DeepSeek V4 PrononevsGrok 4.20medium DeepSeek V4 PrononevsKimi K2.5medium DeepSeek V4 ProhighvsGPT-5 Minimedium GPT-5 MinimediumvsGLM 5none Claude Sonnet 4.6nonevsGPT-5 Minimedium DeepSeek V4 PrononevsGPT-5 Nanomedium GPT-5 MinimediumvsMiMo-V2-Omninone