DeepSeek: DeepSeek V3.2 vs Z.ai: GLM 5.1

GLM 5.1 лидирует по среднему баллу: 5.5 vs 5.0. DeepSeek V3.2 имеет более низкую стоимость benchmark: $0.054 vs $0.164. GLM 5.1 быстрее: 6.70s vs 18.25s, с долей успешных попыток 37.9% vs 40.9%.

Рекомендуемая модельGLM 5.1Здесь у него лучший балл (5.5), и он отвечает примерно в 2.7 раза быстрее, чем DeepSeek V3.2.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-17

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	GLM 5.1 GLM 5.1 none Релиз: 2026-04-07

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	GLM 5.1 GLM 5.1 none Релиз: 2026-04-07
Оценка	5.0	5.5
Ранг	#165	#144
Надежность	10.0	10.0
Стабильность	7.7	8.2
Тестов верно
Доля успешных попыток	37.9%	40.9%
Нестабильные тесты	6	5
Всего запусков	66	66
Стоимость за результат	0.870	2.368
Общая стоимость	$0.054	$0.164
Цена входа	$0.269 / 1M	$0.966 / 1M
Цена выхода	$0.400 / 1M	$3.036 / 1M
Общее число входных токенов	135,780	124,209
Выходные токены	42,097	14,393
Токены рассуждений	0	0
Время ответа (среднее)	18.25s	6.70s
Время ответа (макс.)	115.89s	61.20s
Время ответа (суммарно)	401.60s	147.38s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#165 DeepSeek V3.2

none

Стоимость: $0.002
Время: 7.0s
Токены: 1,046 tok

#144 GLM 5.1

none

Неверный SVG

Стоимость: $0.000
Время: 300.0s
Токены: 0 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.2	8.0	8.3%	1		9.35s	494	1,073	0
GLM 5.1	4.0	6.3	25.0%	2		2.11s	555	305	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.1	6.9	11.1%	1		14.54s	7,279	4,528	0
GLM 5.1	3.9	9.7	0.0%	0		4.96s	7,256	525	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	4.8	10.0	0.0%	0		113.53s	109,626	33,819	0
GLM 5.1	2.8	1.8	33.3%	2		46.88s	99,907	12,768	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	7,890	1,710	0
GLM 5.1	10.0	10.0	100.0%	0		1.08s	7,107	204	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	2.9	7.2	11.1%	1		4.17s	624	21	0
GLM 5.1	2.9	7.2	11.1%	1		1.99s	687	24	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	4.7	1.6	66.7%	1		9.32s	314	43	0
GLM 5.1	5.0	10.0	0.0%	0		790ms	477	39	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	627	66	0
GLM 5.1	9.8	10.0	100.0%	0		1.98s	636	66	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.6	7.2	77.8%	1		6.91s	424	298	0
GLM 5.1	7.7	10.0	66.7%	0		1.45s	609	151	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	8,319	522	0
GLM 5.1	10.0	10.0	100.0%	0		10.68s	6,789	300	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	183	17	0
GLM 5.1	3.0	10.0	0.0%	0		2.34s	186	11	0

Быстрое сравнение

Сменить пару сравнения

KAT-Coder-Air V2.5mediumvsGLM 5.1none DeepSeek V3.2nonevsMiniMax M2.7medium KAT-Coder-Air V2.5highvsGLM 5.1none DeepSeek V3.2nonevsMistral Small 4medium KAT-Coder-Air V2.5lowvsGLM 5.1none Nemotron 3 SupermediumБесплатно доступноvsGLM 5.1none DeepSeek V3.2nonevsQwen3 Coder Nextmedium CobuddymediumvsDeepSeek V3.2none North Mini CodemediumБесплатно доступноvsGLM 5.1none DeepSeek V3.2nonevsKAT-Coder-Air V2.5low DeepSeek V3.2nonevsMiniMax M2.5medium Mistral Small 4mediumvsGLM 5.1none