AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemma 4 31B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-10

Метрика	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01	Gemma 4 31B Gemma 4 31B none Релиз: 2026-04-02 Бесплатно доступно

Метрика	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01	Gemma 4 31B Gemma 4 31B none Релиз: 2026-04-02 Бесплатно доступно
Оценка	7.2	6.9
Ранг	#61	#66
Надежность	10.0	10.0
Стабильность	7.5	10.0
Тестов верно
Доля успешных попыток	72.8%	52.6%
Нестабильные тесты	6	0
Всего запусков	57	57
Стоимость за результат	0.278	0.025
Общая стоимость	$0.031	$0.003
???? ?????	$0.252 / 1M	$0.130 / 1M
???? ??????	$0.378 / 1M	$0.380 / 1M
Выходные токены	7,035	1,371
Токены рассуждений	53,765	0
Время ответа (среднее)	46.06s	3.86s
Время ответа (макс.)	180.92s	26.13s
Время ответа (суммарно)	875.23s	65.57s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	9.2	10.0	100.0%	0		24.23s	3,247	6,953
Gemma 4 31B	6.5	10.0	50.0%	0		1.85s	45	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	4.7	1.6	66.7%	1		180.92s	626	6,792
Gemma 4 31B	10.0	10.0	100.0%	0		26.13s	699	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		93.11s	571	6,296
Gemma 4 31B	3.0	10.0	0.0%	0		0ms	0	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		36.09s	207	7,693
Gemma 4 31B	10.0	10.0	100.0%	0		2.25s	285	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	2.9	4.4	22.2%	2		24.27s	21	6,838
Gemma 4 31B	7.7	10.0	66.7%	0		3.22s	27	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.8	2.5	50.0%	1		58.29s	49	2,189
Gemma 4 31B	10.0	10.0	100.0%	0		2.09s	117	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		35.78s	1,397	2,845
Gemma 4 31B	6.5	10.0	50.0%	0		2.84s	78	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.7	5.0	66.7%	2		36.87s	390	6,281
Gemma 4 31B	6.5	10.0	33.3%	0		2.95s	108	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		34.81s	507	859
Gemma 4 31B	3.0	10.0	0.0%	0		0ms	0	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		83.99s	20	7,019
Gemma 4 31B	3.0	10.0	0.0%	0		1.25s	12	0

Быстрое сравнение

Сменить пару сравнения

Claude Sonnet 4.6nonevsDeepSeek V3.2medium DeepSeek V4 ProhighvsGemma 4 31BnoneБесплатно доступно Gemma 4 31BnoneБесплатно доступноvsGrok 4.20medium Gemma 4 31BnoneБесплатно доступноvsGPT-5 Minimedium DeepSeek V3.2mediumvsRing 2.6 1tnoneБесплатно доступно DeepSeek V3.2mediumvsQwen3.6 Max Previewnone Gemma 4 31BnoneБесплатно доступноvsKimi K2.5medium Gemma 4 31BnoneБесплатно доступноvsQwen3.6 27Bmedium Gemma 4 31BnoneБесплатно доступноvsMiMo-V2-Omnimedium Gemma 4 31BnoneБесплатно доступноvsGPT-5.4 Minimedium Gemma 4 31BnoneБесплатно доступноvsGPT-5.2medium Gemma 4 31BnoneБесплатно доступноvsQwen3.5-35B-A3Bmedium