AI BENCHY Compare

OpenAI: GPT-5.4 vs Z.ai: GLM 5

Сводка

Сравнение benchmark GPT-5.4 vs GLM 5: Средний балл практически равен: 8.5 vs 8.6. GLM 5 имеет более низкую стоимость benchmark: $0.228 vs $1.210. GPT-5.4 быстрее: 22.35s vs 33.54s, с долей успешных попыток 76.2% vs 82.5%.

Рекомендуемая модель: GLM 5 - Здесь у него лучший балл (8.6), при этом он примерно в 5.3 раза дешевле, чем GPT-5.4.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-02

Метрика	GPT-5.4 GPT-5.4 medium Релиз: 2026-03-05	GLM 5 GLM 5 medium Релиз: 2026-02-12

Метрика	GPT-5.4 GPT-5.4 medium Релиз: 2026-03-05	GLM 5 GLM 5 medium Релиз: 2026-02-12
Оценка	8.5	8.6
Ранг	#17	#15
Надежность	10.0	10.0
Стабильность	8.6	8.5
Тестов верно
Доля успешных попыток	76.2%	82.5%
Нестабильные тесты	4	4
Всего запусков	63	63
Стоимость за результат	8.640	1.668
Общая стоимость	$1.210	$0.228
Цена входа	$2.500 / 1M	$0.600 / 1M
Цена выхода	$15.000 / 1M	$1.920 / 1M
Общее число входных токенов	34,108	35,224
Выходные токены	2,242	21,570
Токены рассуждений	72,707	102,996
Время ответа (среднее)	22.35s	33.54s
Время ответа (макс.)	100.41s	99.85s
Время ответа (суммарно)	469.29s	435.99s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#17 GPT-5.4

medium

Стоимость: $0.214
Время: 199.6s
Токены: 14,349 tok

#15 GLM 5

medium

Стоимость: $0.005
Время: 20.7s
Токены: 2,068 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4	8.3	10.0	75.0%	0		4.11s	606	240	1,511
GLM 5	10.0	10.0	100.0%	0		23.66s	555	480	7,056

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4	8.8	7.8	88.9%	1		44.36s	7,305	433	24,216
GLM 5	10.0	10.0	100.0%	0		74.30s	7,254	2,997	52,930

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4	10.0	10.0	100.0%	0		20.57s	11,019	301	3,543
GLM 5	10.0	10.0	100.0%	0		28.96s	12,804	662	3,242

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4	10.0	10.0	100.0%	0		5.32s	7,140	234	804
GLM 5	7.1	5.6	83.3%	1		8.90s	5,508	567	3,734

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4	5.3	7.2	44.4%	1		74.27s	619	61	34,748
GLM 5	3.5	4.4	33.3%	2		0ms	260	13,176	14,137

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4	4.7	3.1	33.3%	1		4.92s	477	145	321
GLM 5	6.1	3.1	66.7%	1		14.69s	477	2,020	2,248

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4	10.0	10.0	100.0%	0		3.11s	660	93	897
GLM 5	10.0	10.0	100.0%	0		7.25s	636	1,001	2,129

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4	8.2	7.2	88.9%	1		9.14s	642	441	3,815
GLM 5	10.0	10.0	100.0%	0		11.33s	609	33	4,076

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4	10.0	10.0	100.0%	0		13.28s	5,445	264	1,031
GLM 5	10.0	10.0	100.0%	0		15.93s	6,935	233	994

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4	3.0	10.0	0.0%	0		13.95s	195	30	1,821
GLM 5	3.0	10.0	0.0%	0		67.37s	186	401	12,450

Быстрое сравнение

Сменить пару сравнения

GPT-5.2 ChatnonevsGLM 5medium DeepSeek V4 FlashhighvsGPT-5.4medium DeepSeek V4 FlashhighvsGLM 5medium Gemini 3.5 FlashlowvsGLM 5medium Gemini 3.5 FlashlowvsGPT-5.4medium GPT-5.5lowvsGLM 5medium Claude Opus 4.8lowvsGPT-5.4medium Claude Opus 4.8lowvsGLM 5medium GPT-5.4mediumvsStep 3.7 Flashlow Step 3.7 FlashlowvsGLM 5medium DeepSeek V4 ProhighvsGPT-5.4medium DeepSeek V4 ProhighvsGLM 5medium