AI BENCHY Compare

OpenAI: GPT-5.5 vs Z.ai: GLM 5 Turbo

Сводка

Сравнение benchmark GPT-5.5 vs GLM 5 Turbo: GPT-5.5 лидирует по среднему баллу: 9.3 vs 5.3. GLM 5 Turbo имеет более низкую стоимость benchmark: $0.047 vs $0.907. GLM 5 Turbo быстрее: 2.82s vs 9.76s, с долей успешных попыток 85.7% vs 31.8%.

Рекомендуемая модель: GPT-5.5 - У него самый высокий балл в этом сравнении (9.3) и лучший общий баланс стоимости и времени ответа среди всех 2 моделей.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-12

Метрика	GPT-5.5 GPT-5.5 low Релиз: 2026-04-24	GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15

Метрика	GPT-5.5 GPT-5.5 low Релиз: 2026-04-24	GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15
Оценка	9.3	5.3
Ранг	#5	#128
Надежность	10.0	10.0
Стабильность	10.0	9.3
Тестов верно
Доля успешных попыток	85.7%	31.8%
Нестабильные тесты	0	2
Всего запусков	63	63
Стоимость за результат	5.035	0.655
Общая стоимость	$0.907	$0.047
Цена входа	$5.000 / 1M	$1.200 / 1M
Цена выхода	$30.000 / 1M	$4.000 / 1M
Общее число входных токенов	34,209	32,525
Выходные токены	2,046	1,815
Токены рассуждений	22,460	0
Время ответа (среднее)	9.76s	2.82s
Время ответа (макс.)	56.19s	8.21s
Время ответа (суммарно)	204.92s	59.29s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#5 GPT-5.5

low

Cost: $0.068
Time: 37.0s
Tokens: 2,339 tok

#128 GLM 5 Turbo

none

Cost: $0.047
Time: 129.2s
Tokens: 11,775 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		4.41s	606	238	1,020
GLM 5 Turbo	3.0	10.0	0.0%	0		2.84s	555	382	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		15.04s	7,302	423	6,402
GLM 5 Turbo	3.9	7.8	11.1%	1		2.41s	7,256	529	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		9.56s	11,019	303	717
GLM 5 Turbo	3.0	10.0	0.0%	0		4.89s	8,133	144	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		3.28s	7,140	228	157
GLM 5 Turbo	10.0	10.0	100.0%	0		2.47s	7,107	204	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	5.3	10.0	33.3%	0		28.05s	723	69	11,609
GLM 5 Turbo	5.3	10.0	33.3%	0		1.97s	687	25	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		5.17s	477	133	245
GLM 5 Turbo	4.2	9.9	0.0%	0		2.18s	477	48	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	9.9	10.0	100.0%	0		3.74s	660	93	415
GLM 5 Turbo	6.5	10.0	50.0%	0		2.13s	636	65	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		4.74s	642	279	954
GLM 5 Turbo	5.5	7.4	44.4%	1		2.65s	609	180	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		4.96s	5,445	250	101
GLM 5 Turbo	10.0	10.0	100.0%	0		8.21s	6,879	222	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	3.0	10.0	0.0%	0		10.06s	195	30	840
GLM 5 Turbo	3.0	10.0	0.0%	0		2.37s	186	16	0

Быстрое сравнение

Сменить пару сравнения

GPT-5.5lowvsQwen3.7 Maxmedium Claude Fable 5mediumvsGPT-5.5low Gemini 3.1 Pro PreviewmediumvsGPT-5.5low MiniMax M2.7mediumvsGLM 5 Turbonone Gemini 3.5 FlashmediumvsGPT-5.5low Mistral Small 4mediumvsGLM 5 Turbonone Gemini 3 Flash PreviewmediumvsGPT-5.5low CobuddymediumvsGLM 5 Turbonone GPT-5.5lowvsQwen3.6 Max Previewmedium Claude Opus 4.8mediumvsGPT-5.5low Gemini 3.5 FlashhighvsGPT-5.5low MiniMax M2.5mediumvsGLM 5 Turbonone