AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemma 4 31B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-29

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	Gemma 4 31B Gemma 4 31B none Релиз: 2026-04-02 Бесплатно доступно

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	Gemma 4 31B Gemma 4 31B none Релиз: 2026-04-02 Бесплатно доступно
Оценка	6.2	6.7
Ранг	#97	#83
Надежность	10.0	10.0
Стабильность	8.3	10.0
Тестов верно
Доля успешных попыток	48.3%	50.0%
Нестабильные тесты	4	0
Всего запусков	60	60
Стоимость за результат	0.222	0.030
Общая стоимость	$0.018	$0.003
Цена входа	$0.252 / 1M	$0.120 / 1M
Цена выхода	$0.378 / 1M	$0.370 / 1M
Выходные токены	11,159	1,398
Токены рассуждений	0	0
Время ответа (среднее)	14.43s	4.05s
Время ответа (макс.)	115.89s	26.13s
Время ответа (суммарно)	288.55s	72.97s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.8	8.2	12.5%	1		9.35s	1,073	0
Gemma 4 31B	6.5	10.0	50.0%	0		1.85s	45	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.1	5.4	16.7%	1		20.87s	4,522	0
Gemma 4 31B	6.8	10.0	50.0%	0		14.84s	726	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
Gemma 4 31B	3.0	10.0	0.0%	0		0ms	0	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
Gemma 4 31B	10.0	10.0	100.0%	0		2.25s	285	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.2	6.9	16.7%	1		4.17s	21	0
Gemma 4 31B	7.7	10.0	66.7%	0		3.22s	27	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		9.32s	43	0
Gemma 4 31B	10.0	10.0	100.0%	0		2.09s	117	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
Gemma 4 31B	6.5	10.0	50.0%	0		2.84s	78	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		6.91s	298	0
Gemma 4 31B	6.5	10.0	33.3%	0		4.23s	108	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
Gemma 4 31B	3.0	10.0	0.0%	0		0ms	0	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	17	0
Gemma 4 31B	3.0	10.0	0.0%	0		1.25s	12	0

Быстрое сравнение

Сменить пару сравнения

Gemma 4 31BnoneБесплатно доступноvsKimi K2.5medium DeepSeek V3.2nonevsGPT-5 Nanomedium Gemma 4 31BnoneБесплатно доступноvsQwen3.6 27Bmedium Gemma 4 31BnoneБесплатно доступноvsMercury 2medium Gemma 4 31BnoneБесплатно доступноvsMiMo-V2-Omnimedium DeepSeek V3.2nonevsNemotron 3 SupermediumБесплатно доступно DeepSeek V3.2nonevsgpt-oss-120bmediumБесплатно доступно Gemma 4 31BnoneБесплатно доступноvsGrok 4.20medium DeepSeek V3.2nonevsOwl Alphamedium DeepSeek V4 ProhighvsGemma 4 31BnoneБесплатно доступно DeepSeek V3.2nonevsMercury 2medium Gemma 4 31BnoneБесплатно доступноvsMiMo-V2-Flashmedium