AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Z.ai: GLM 5 Turbo

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15
Оценка	5.6	5.3
Ранг	#114	#125
Надежность	10.0	10.0
Стабильность	8.0	9.3
Тестов верно
Доля успешных попыток	46.7%	33.3%
Нестабильные тесты	5	2
Всего запусков	60	60
Стоимость за результат	0.254	0.602
Общая стоимость	$0.018	$0.037
???? ?????	$0.252 / 1M	$1.200 / 1M
???? ??????	$0.378 / 1M	$4.000 / 1M
Выходные токены	11,163	1,809
Токены рассуждений	0	0
Время ответа (среднее)	14.46s	2.83s
Время ответа (макс.)	115.89s	8.21s
Время ответа (суммарно)	289.21s	56.58s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.3	8.2	12.5%	1		9.35s	1,073	0
GLM 5 Turbo	3.0	10.0	0.0%	0		2.84s	382	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.1	5.4	16.7%	1		20.87s	4,522	0
GLM 5 Turbo	4.4	6.7	16.7%	1		2.58s	523	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
GLM 5 Turbo	3.0	10.0	0.0%	0		4.89s	144	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
GLM 5 Turbo	10.0	10.0	100.0%	0		2.47s	204	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	6.9	16.7%	1		4.17s	21	0
GLM 5 Turbo	5.3	10.0	33.3%	0		1.97s	25	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.6	10.0	100.0%	0		9.32s	43	0
GLM 5 Turbo	4.2	9.9	0.0%	0		2.18s	48	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
GLM 5 Turbo	6.5	10.0	50.0%	0		2.13s	65	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.5	7.7	88.9%	1		7.13s	302	0
GLM 5 Turbo	5.5	7.4	44.4%	1		2.43s	180	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
GLM 5 Turbo	10.0	10.0	100.0%	0		8.21s	222	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	17	0
GLM 5 Turbo	3.0	10.0	0.0%	0		2.37s	16	0

Быстрое сравнение

Сменить пару сравнения

DeepSeek V3.2nonevsgpt-oss-120bmediumБесплатно доступно Elephant AlphamediumvsGLM 5 Turbonone Mistral Small 4mediumvsGLM 5 Turbonone MiniMax M2.5mediumБесплатно доступноvsGLM 5 Turbonone DeepSeek V3.2nonevsMiniMax M2.5mediumБесплатно доступно DeepSeek V3.2nonevsMistral Small 4medium CobuddymediumБесплатно доступноvsDeepSeek V3.2none DeepSeek V3.2nonevsElephant Alphamedium MiniMax M2.7mediumvsGLM 5 Turbonone DeepSeek V3.2nonevsOwl Alphamedium gpt-oss-120bmediumБесплатно доступноvsGLM 5 Turbonone DeepSeek V3.2nonevsNemotron 3 SupermediumБесплатно доступно