AI BENCHY Compare

OpenAI: gpt-oss-120b vs Z.ai: GLM 5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-29

Метрика	gpt-oss-120b gpt-oss-120b medium Релиз: 2025-08-05 Бесплатно доступно	GLM 5 GLM 5 none Релиз: 2026-02-12

Метрика	gpt-oss-120b gpt-oss-120b medium Релиз: 2025-08-05 Бесплатно доступно	GLM 5 GLM 5 none Релиз: 2026-02-12
Оценка	5.9	6.3
Ранг	#103	#96
Надежность	10.0	10.0
Стабильность	7.9	9.7
Тестов верно
Доля успешных попыток	50.0%	46.7%
Нестабильные тесты	5	1
Всего запусков	60	60
Стоимость за результат	0.151	0.246
Общая стоимость	$0.013	$0.023
Цена входа	$0.039 / 1M	$0.600 / 1M
Цена выхода	$0.180 / 1M	$1.920 / 1M
Выходные токены	17,495	1,985
Токены рассуждений	46,878	0
Время ответа (среднее)	22.41s	3.95s
Время ответа (макс.)	68.16s	11.07s
Время ответа (суммарно)	291.35s	51.38s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
gpt-oss-120b	6.7	9.9	50.0%	0		10.21s	3,518	2,177
GLM 5	4.8	10.0	25.0%	0		2.37s	275	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
gpt-oss-120b	3.9	5.6	33.3%	1		47.24s	847	8,618
GLM 5	4.6	6.8	16.7%	1		5.18s	424	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
gpt-oss-120b	10.0	10.0	100.0%	0		31.18s	694	5,072
GLM 5	3.0	10.0	0.0%	0		4.98s	406	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
gpt-oss-120b	6.4	5.9	66.7%	1		1.98s	241	1,114
GLM 5	10.0	10.0	100.0%	0		5.78s	203	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
gpt-oss-120b	2.9	4.4	22.2%	2		50.92s	6,784	20,606
GLM 5	3.0	10.0	0.0%	0		2.24s	19	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
gpt-oss-120b	4.3	10.0	0.0%	0		7.90s	107	387
GLM 5	10.0	10.0	100.0%	0		3.27s	103	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
gpt-oss-120b	9.9	10.0	100.0%	0		7.63s	126	1,799
GLM 5	10.0	10.0	100.0%	0		1.48s	61	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
gpt-oss-120b	5.3	7.2	44.4%	1		21.71s	1,790	2,264
GLM 5	7.7	10.0	66.7%	0		1.91s	261	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
gpt-oss-120b	9.8	10.0	100.0%	0		6.91s	287	1,083
GLM 5	10.0	10.0	100.0%	0		11.07s	220	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
gpt-oss-120b	3.0	10.0	0.0%	0		26.51s	3,101	3,758
GLM 5	3.0	10.0	0.0%	0		3.62s	13	0

Быстрое сравнение

Сменить пару сравнения

gpt-oss-120bmediumБесплатно доступноvsQwen3.5-Flashnone gpt-oss-120bmediumБесплатно доступноvsGLM 5V Turbonone Seed-2.0-Litenonevsgpt-oss-120bmediumБесплатно доступно gpt-oss-120bmediumБесплатно доступноvsGLM 5.1none gpt-oss-120bmediumБесплатно доступноvsQwen3.5 Plus 2026-04-20none gpt-oss-120bmediumБесплатно доступноvsQwen3.5-35B-A3Bnone gpt-oss-120bmediumБесплатно доступноvsQwen3.5-27Bnone gpt-oss-120bmediumБесплатно доступноvsQwen3.6 27Bnone GPT-5 NanomediumvsGLM 5none Mercury 2mediumvsGLM 5none gpt-oss-120bmediumБесплатно доступноvsMiMo-V2-Pronone gpt-oss-120bmediumБесплатно доступноvsMiMo-V2-Omninone