AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 2.5 Flash

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-29

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	Gemini 2.5 Flash Gemini 2.5 Flash medium Релиз: 2025-06-17

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	Gemini 2.5 Flash Gemini 2.5 Flash medium Релиз: 2025-06-17
Оценка	6.0	8.2
Ранг	#84	#20
Надежность	Н/Д	Н/Д
Стабильность	8.6	9.5
Тестов верно
Доля успешных попыток	46.3%	75.9%
Нестабильные тесты	3	1
Всего запусков	52	54
Стоимость за результат	0.225	2.454
Общая стоимость	$0.016	$0.319
???? ?????	$0.252 / 1M	$0.300 / 1M
???? ??????	$0.378 / 1M	$2.500 / 1M
Выходные токены	8,378	1,898
Токены рассуждений	0	122,273
Время ответа (среднее)	12.07s	12.12s
Время ответа (макс.)	115.89s	95.48s
Время ответа (суммарно)	217.28s	218.12s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.2	9.8	0.0%	0		7.63s	1,419	0
Gemini 2.5 Flash	8.4	10.0	75.0%	0		6.30s	255	10,233

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	2.4	1.3	33.3%	1		7.63s	553	0
Gemini 2.5 Flash	10.0	10.0	100.0%	0		16.23s	522	10,350

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
Gemini 2.5 Flash	10.0	10.0	100.0%	0		28.44s	303	11,922

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
Gemini 2.5 Flash	10.0	10.0	100.0%	0		4.06s	279	2,325

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		1.52s	18	0
Gemini 2.5 Flash	5.9	7.2	55.6%	1		37.34s	18	80,702

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		2.86s	67	0
Gemini 2.5 Flash	4.8	10.0	0.0%	0		4.86s	92	1,899

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
Gemini 2.5 Flash	9.8	10.0	100.0%	0		2.62s	69	1,203

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	8.5	7.5	88.9%	1		7.37s	1,136	0
Gemini 2.5 Flash	7.7	10.0	66.7%	0		3.94s	126	2,499

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
Gemini 2.5 Flash	10.0	10.0	100.0%	0		6.20s	234	1,140

Быстрое сравнение

Сменить пару сравнения

Gemini 2.5 FlashmediumvsHY3 PreviewlowБесплатно доступно DeepSeek V3.2nonevsLaguna Xs.2mediumБесплатно доступно DeepSeek V3.2nonevsgpt-oss-120bmediumБесплатно доступно DeepSeek V3.2nonevsGPT-5 Nanomedium Gemini 2.5 FlashmediumvsHY3 PreviewhighБесплатно доступно Gemini 2.5 FlashmediumvsGPT-5.2 Chatnone DeepSeek V3.2nonevsMiniMax M2.5mediumБесплатно доступно DeepSeek V3.2nonevsLaguna M.1mediumБесплатно доступно DeepSeek V3.2nonevsMistral Small 4medium DeepSeek V4 FlashhighvsGemini 2.5 Flashmedium DeepSeek V3.2nonevsMercury 2medium Gemini 2.5 FlashmediumvsGPT-5.3 Chatnone