AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 3.5 Flash

Сводка

Сравнение benchmark DeepSeek V3.2 vs Gemini 3.5 Flash: DeepSeek V3.2 лидирует по среднему баллу: 7.5 vs 7.0. DeepSeek V3.2 имеет более низкую стоимость benchmark: $0.044 vs $1.079. Gemini 3.5 Flash быстрее: 9.93s vs 68.71s, с долей успешных попыток 65.1% vs 77.8%.

Рекомендуемая модель: DeepSeek V3.2 - Здесь у него лучший балл (7.5), при этом он примерно в 24.6 раза дешевле, чем Gemini 3.5 Flash.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-18

Метрика	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01	Gemini 3.5 Flash Gemini 3.5 Flash none Релиз: 2026-05-19

Метрика	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01	Gemini 3.5 Flash Gemini 3.5 Flash none Релиз: 2026-05-19
Оценка	7.5	7.0
Ранг	#48	#66
Надежность	10.0	10.0
Стабильность	7.6	8.9
Тестов верно
Доля успешных попыток	65.1%	77.8%
Нестабильные тесты	6	3
Всего запусков	63	63
Стоимость за результат	0.436	7.190
Общая стоимость	$0.044	$1.079
Цена входа	$0.229 / 1M	$1.500 / 1M
Цена выхода	$0.344 / 1M	$9.000 / 1M
Общее число входных токенов	38,333	13,843
Выходные токены	7,186	117,518
Токены рассуждений	99,081	0
Время ответа (среднее)	68.71s	9.93s
Время ответа (макс.)	376.10s	64.36s
Время ответа (суммарно)	1442.81s	178.68s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#48 DeepSeek V3.2

medium

Стоимость: $0.001
Время: 53.6s
Токены: 1,932 tok

#66 Gemini 3.5 Flash

none

Стоимость: $0.225
Время: 125.5s
Токены: 25,004 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	8.2	7.9	83.3%	1		24.23s	448	3,247	6,953
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.53s	492	5,101	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.0	7.2	55.6%	1		248.68s	5,717	649	52,014
Gemini 3.5 Flash	8.8	7.8	88.9%	1		34.69s	8,122	75,927	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		93.11s	14,283	571	6,296
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		36.09s	7,388	207	7,693
Gemini 3.5 Flash	6.5	10.0	50.0%	0		8.10s	2,781	5,895	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	2.9	4.4	22.2%	2		24.27s	472	21	6,838
Gemini 3.5 Flash	7.6	7.2	77.8%	1		10.64s	633	17,910	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.4	2.5	33.3%	1		58.29s	314	49	2,189
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.46s	486	1,620	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		35.78s	627	1,397	2,845
Gemini 3.5 Flash	9.8	10.0	100.0%	0		3.38s	615	3,928	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.0	7.2	55.6%	1		37.69s	594	518	6,375
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.13s	558	4,640	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		34.81s	8,307	507	859
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		83.99s	183	20	7,019
Gemini 3.5 Flash	2.8	1.6	33.3%	1		4.87s	156	2,497	0

Быстрое сравнение

Сменить пару сравнения

Gemini 3.5 FlashnonevsKimi K2.7 Codemedium DeepSeek V3.2mediumvsGPT-5.3 Chatnone DeepSeek V3.2mediumvsGemini 3 Flash Previewlow Gemini 3.5 FlashnonevsGLM 5.1medium Gemini 3.5 FlashnonevsStep 3.7 Flashhigh Gemini 3.5 FlashnonevsQwen3.5-Flashmedium Claude Sonnet 4.6nonevsDeepSeek V3.2medium Gemini 3.5 FlashnonevsRing-2.6-1Tmedium Claude Opus 4.8nonevsDeepSeek V3.2medium DeepSeek V3.2mediumvsStep 3.7 Flashlow Gemini 3.5 FlashnonevsQwen3.6 35B A3Bmedium Gemini 3.5 FlashnonevsMiMo-V2.5medium