AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Google: Gemini 3.1 Flash Lite

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика	DeepSeek V4 Pro DeepSeek V4 Pro none Релиз: 2026-04-24	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite none Релиз: 2026-05-08

Метрика	DeepSeek V4 Pro DeepSeek V4 Pro none Релиз: 2026-04-24	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite none Релиз: 2026-05-08
Оценка	6.0	6.6
Ранг	#95	#85
Надежность	8.1	10.0
Стабильность	8.9	8.5
Тестов верно
Доля успешных попыток	48.3%	55.0%
Нестабильные тесты	3	4
Всего запусков	60	60
Стоимость за результат	0.564	0.135
Общая стоимость	$0.046	$0.013
???? ?????	$0.435 / 1M	$0.250 / 1M
???? ??????	$0.870 / 1M	$1.500 / 1M
Выходные токены	5,347	2,478
Токены рассуждений	0	0
Время ответа (среднее)	13.48s	1.09s
Время ответа (макс.)	58.65s	2.97s
Время ответа (суммарно)	269.56s	21.79s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	3.5	8.0	16.7%	1		14.02s	704	0
Gemini 3.1 Flash Lite	7.5	8.4	66.7%	1		1.07s	639	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	5.4	6.8	33.3%	1		8.27s	527	0
Gemini 3.1 Flash Lite	6.8	10.0	50.0%	0		1.13s	660	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	9.5	10.0	100.0%	0		25.49s	1,911	0
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		2.73s	357	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	8.8	10.0	100.0%	0		30.54s	170	0
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		843ms	279	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	5.3	10.0	33.3%	0		3.17s	18	0
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		762ms	15	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	4.3	9.9	0.0%	0		3.75s	132	0
Gemini 3.1 Flash Lite	4.0	10.0	0.0%	0		992ms	63	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	6.3	10.0	50.0%	0		8.23s	64	0
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		859ms	72	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	7.6	7.2	77.8%	1		19.72s	175	0
Gemini 3.1 Flash Lite	6.3	4.8	66.7%	2		720ms	150	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	10.0	10.0	100.0%	0		5.92s	219	0
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.97s	234	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Pro	3.0	10.0	0.0%	0		15.59s	1,427	0
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		733ms	9	0

Быстрое сравнение

Сменить пару сравнения

Gemini 3.1 Flash LitenonevsQwen3.6 27Bmedium DeepSeek V4 PrononevsGPT-5 Nanomedium DeepSeek V4 ProhighvsGemini 3.1 Flash Litenone DeepSeek V4 PrononevsNemotron 3 SupermediumБесплатно доступно Gemini 3.1 Flash LitenonevsKimi K2.5medium Gemini 3.1 Flash LitenonevsGrok 4.20medium DeepSeek V4 PrononevsOwl Alphamedium DeepSeek V4 PrononevsMercury 2medium CobuddymediumБесплатно доступноvsDeepSeek V4 Pronone Gemini 3.1 Flash LitenonevsMercury 2medium Gemini 3.1 Flash LitenonevsGPT-5 Minimedium Gemini 3.1 Flash LitenonevsMiMo-V2-Omnimedium