AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Z.ai: GLM 4.7 Flash

Сводка

Сравнение benchmark DeepSeek V4 Flash vs GLM 4.7 Flash: DeepSeek V4 Flash лидирует по среднему баллу: 5.0 vs 4.4. DeepSeek V4 Flash имеет более низкую стоимость benchmark: $0.008 vs $0.054. DeepSeek V4 Flash быстрее: 26.75s vs 35.10s, с долей успешных попыток 30.2% vs 33.3%.

Рекомендуемая модель: DeepSeek V4 Flash - Здесь у него лучший балл (5.0), при этом он примерно в 7.0 раза дешевле, чем GLM 4.7 Flash.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-04

Метрика	DeepSeek V4 Flash DeepSeek V4 Flash none Релиз: 2026-04-24	GLM 4.7 Flash GLM 4.7 Flash medium Релиз: 2026-01-19

Метрика	DeepSeek V4 Flash DeepSeek V4 Flash none Релиз: 2026-04-24	GLM 4.7 Flash GLM 4.7 Flash medium Релиз: 2026-01-19
Оценка	5.0	4.4
Ранг	#139	#158
Надежность	10.0	6.7
Стабильность	8.9	6.8
Тестов верно
Доля успешных попыток	30.2%	33.3%
Нестабильные тесты	3	8
Всего запусков	63	63
Стоимость за результат	0.203	1.337
Общая стоимость	$0.008	$0.054
Цена входа	$0.099 / 1M	$0.060 / 1M
Цена выхода	$0.197 / 1M	$0.400 / 1M
Общее число входных токенов	50,127	37,206
Выходные токены	13,710	43,754
Токены рассуждений	0	89,079
Время ответа (среднее)	26.75s	35.10s
Время ответа (макс.)	111.96s	174.55s
Время ответа (суммарно)	561.82s	456.24s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#139 DeepSeek V4 Flash

none

Cost: $0.004
Time: 157.6s
Tokens: 11,297 tok

#158 GLM 4.7 Flash

medium

Invalid SVG

Cost: $0.000
Time: 186.2s
Tokens: 12,112 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	3.0	10.0	0.0%	0		20.18s	540	174	0
GLM 4.7 Flash	4.7	5.9	41.7%	2		14.95s	555	1,122	6,110

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	4.2	7.4	11.1%	1		17.13s	7,279	9,717	0
GLM 4.7 Flash	3.2	7.4	11.1%	1		55.33s	3,106	4,981	22,387

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	4.5	2.1	66.7%	1		111.96s	24,398	2,664	0
GLM 4.7 Flash	2.8	2.1	33.3%	1		65.57s	17,185	2,585	20,648

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	10.0	10.0	100.0%	0		23.79s	7,290	195	0
GLM 4.7 Flash	6.3	10.0	50.0%	0		1.51s	7,107	584	2,755

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	5.3	10.0	33.3%	0		19.73s	666	18	0
GLM 4.7 Flash	3.5	4.4	33.3%	2		174.55s	643	33,000	25,394

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	4.2	9.9	0.0%	0		23.74s	471	67	0
GLM 4.7 Flash	3.6	9.7	0.0%	0		18.14s	318	18	2,138

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	6.5	10.0	50.0%	0		17.54s	627	321	0
GLM 4.7 Flash	6.2	5.8	66.7%	1		2.97s	636	388	2,181

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	3.1	7.3	11.1%	1		23.72s	594	207	0
GLM 4.7 Flash	2.9	7.2	11.1%	1		12.93s	521	781	5,255

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	10.0	10.0	100.0%	0		77.93s	8,079	327	0
GLM 4.7 Flash	10.0	10.0	100.0%	0		15.95s	6,949	224	1,014

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	3.0	10.0	0.0%	0		3.07s	183	20	0
GLM 4.7 Flash	3.0	10.0	0.0%	0		11.13s	186	71	1,197

Быстрое сравнение

Сменить пару сравнения

Ling-2.6-1TnonevsGLM 4.7 Flashmedium Mercury 2nonevsGLM 4.7 Flashmedium Qwen3.5-9BnonevsGLM 4.7 Flashmedium Qwen3.6 35B A3BnonevsGLM 4.7 Flashmedium MiMo-V2-FlashnonevsGLM 4.7 Flashmedium Trinity Large PreviewnonevsGLM 4.7 Flashmedium GPT-5.4 NanononevsGLM 4.7 Flashmedium DeepSeek V4 FlashnonevsMistral Small 4medium DeepSeek V4 FlashnonevsMiniMax M2.7medium DeepSeek V4 FlashnonevsQwen3 Coder Nextmedium Granite 4.1 8BnonevsGLM 4.7 Flashmedium DeepSeek V4 FlashnonevsMiniMax M2.5medium