AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Google: Gemini 3.5 Flash

Сводка

Сравнение benchmark DeepSeek V4 Pro vs Gemini 3.5 Flash: Gemini 3.5 Flash лидирует по среднему баллу: 9.1 vs 7.6. DeepSeek V4 Pro имеет более низкую стоимость benchmark: $0.157 vs $0.582. Gemini 3.5 Flash быстрее: 4.94s vs 77.20s, с долей успешных попыток 66.7% vs 87.3%.

Рекомендуемая модель: Gemini 3.5 Flash - Здесь у него лучший балл (9.1), и он отвечает примерно в 15.6 раза быстрее, чем DeepSeek V4 Pro.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-02

Метрика	DeepSeek V4 Pro DeepSeek V4 Pro high Релиз: 2026-04-24	Gemini 3.5 Flash Gemini 3.5 Flash medium Релиз: 2026-05-19

Метрика	DeepSeek V4 Pro DeepSeek V4 Pro high Релиз: 2026-04-24	Gemini 3.5 Flash Gemini 3.5 Flash medium Релиз: 2026-05-19
Оценка	7.6	9.1
Ранг	#43	#8
Надежность	9.3	10.0
Стабильность	7.0	9.6
Тестов верно
Доля успешных попыток	66.7%	87.3%
Нестабильные тесты	8	1
Всего запусков	63	63
Стоимость за результат	1.742	3.229
Общая стоимость	$0.157	$0.582
Цена входа	$0.435 / 1M	$1.500 / 1M
Цена выхода	$0.870 / 1M	$9.000 / 1M
Общее число входных токенов	38,726	36,936
Выходные токены	6,334	2,001
Токены рассуждений	159,151	56,408
Время ответа (среднее)	77.20s	4.94s
Время ответа (макс.)	416.76s	18.07s
Время ответа (суммарно)	1621.17s	103.79s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#43 DeepSeek V4 Pro

high

Стоимость: $0.023
Время: 257.6s
Токены: 14,870 tok

#8 Gemini 3.5 Flash

medium

Стоимость: $0.201
Время: 112.9s
Токены: 22,371 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	5.7	5.9	58.3%	2		25.70s	536	149	3,214
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.09s	492	171	3,385

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	6.1	4.6	66.7%	2		243.00s	5,090	383	84,580
Gemini 3.5 Flash	7.9	7.5	77.8%	1		12.63s	8,118	461	24,939

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	10.0	10.0	100.0%	0		38.17s	14,060	454	5,836
Gemini 3.5 Flash	10.0	10.0	100.0%	0		12.05s	12,873	351	7,807

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	10.0	10.0	100.0%	0		25.03s	7,690	274	2,166
Gemini 3.5 Flash	10.0	10.0	100.0%	0		4.07s	7,548	279	3,784

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	3.6	7.2	22.2%	1		151.46s	569	4,404	50,391
Gemini 3.5 Flash	7.7	10.0	66.7%	0		5.24s	633	12	8,047

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	10.0	10.0	100.0%	0		8.83s	471	115	1,013
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.52s	486	115	1,144

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	7.8	6.6	83.3%	1		8.73s	627	66	2,726
Gemini 3.5 Flash	9.9	10.0	100.0%	0		2.70s	615	71	2,855

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	6.9	4.9	77.8%	2		56.85s	591	178	2,563
Gemini 3.5 Flash	7.7	10.0	66.7%	0		2.38s	558	295	2,747

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	9.8	10.0	100.0%	0		15.92s	8,909	295	701
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.81s	5,457	234	455

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	3.0	10.0	0.0%	0		34.01s	183	16	5,961
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.75s	156	12	1,245

Быстрое сравнение

Сменить пару сравнения

DeepSeek V4 ProhighvsMiniMax M3medium DeepSeek V4 ProhighvsGrok Build 0.1medium DeepSeek V4 ProhighvsKimi K2.5medium DeepSeek V4 ProhighvsMercury 2medium DeepSeek V4 ProhighvsStep 3.7 Flashlow Claude Opus 4.6mediumvsDeepSeek V4 Prohigh DeepSeek V4 ProhighvsGPT-5.3 Chatnone DeepSeek V4 ProhighvsGPT-5.4 Nanomedium DeepSeek V4 ProhighvsGrok 4.3medium Claude Opus 4.8lowvsDeepSeek V4 Prohigh DeepSeek V4 ProhighvsQwen3.5-122B-A10Bmedium DeepSeek V4 ProhighvsQwen3.6 Flashmedium