AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 3.1 Flash Lite

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-08

Метрика	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite none Релиз: 2026-05-08

Метрика	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite none Релиз: 2026-05-08
Оценка	7.2	6.7
Ранг	#59	#73
Надежность	10.0	10.0
Стабильность	7.5	8.4
Тестов верно
Доля успешных попыток	72.8%	57.9%
Нестабильные тесты	6	4
Всего запусков	57	57
Стоимость за результат	0.278	0.123
Общая стоимость	$0.031	$0.012
???? ?????	$0.252 / 1M	$0.250 / 1M
???? ??????	$0.378 / 1M	$1.500 / 1M
Выходные токены	7,035	2,454
Токены рассуждений	53,765	0
Время ответа (среднее)	46.06s	1.11s
Время ответа (макс.)	180.92s	2.97s
Время ответа (суммарно)	875.23s	21.13s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	9.2	10.0	100.0%	0		24.23s	3,247	6,953
Gemini 3.1 Flash Lite	7.5	8.4	66.7%	1		1.07s	639	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	4.7	1.6	66.7%	1		180.92s	626	6,792
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.59s	636	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		93.11s	571	6,296
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		2.73s	357	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		36.09s	207	7,693
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		843ms	279	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	2.9	4.4	22.2%	2		24.27s	21	6,838
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		762ms	15	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.8	2.5	50.0%	1		58.29s	49	2,189
Gemini 3.1 Flash Lite	4.0	10.0	0.0%	0		992ms	63	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		35.78s	1,397	2,845
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		859ms	72	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.7	5.0	66.7%	2		36.87s	390	6,281
Gemini 3.1 Flash Lite	6.3	4.8	66.7%	2		720ms	150	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		34.81s	507	859
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.97s	234	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		83.99s	20	7,019
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		733ms	9	0

Быстрое сравнение

Сменить пару сравнения

Claude Sonnet 4.6nonevsDeepSeek V3.2medium DeepSeek V3.2mediumvsQwen3.6 Max Previewnone Gemini 3.1 Flash LitenonevsQwen3.6 27Bmedium Gemini 3.1 Flash LitenonevsKimi K2.5medium Gemini 3.1 Flash LitenonevsGPT-5 Minimedium Gemini 3.1 Flash LitenonevsGrok 4.20medium DeepSeek V4 ProhighvsGemini 3.1 Flash Litenone Gemini 3.1 Flash LitenonevsGrok 4.1 Fastmedium DeepSeek V3.2mediumvsGemma 4 31BnoneБесплатно доступно DeepSeek V3.2mediumvsGemini 3.1 Flash Liteminimal DeepSeek V3.2mediumvsGPT-5.3 Chatnone Gemini 3.1 Flash LitenonevsMercury 2medium