Сравниваемые модели

Бенчмарк-сравнение GLM 5 (medium) vs GLM 5.1 (medium) vs GLM 5 vs GLM 5.1: GLM 5 (medium) лидирует по Оценка со значением 7.7. GLM 5 (medium) лидирует по Надежность со значением 10.0. У GLM 5 самый низкий Общая стоимость: $0.041. GLM 5 самый быстрый: 4.03s.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Ранг: #49
Общее число выходных токенов: 124,566
Время ответа (среднее): 33.54s
Общая стоимость: $0.307

Ранг: #82
Общее число выходных токенов: 152,552
Время ответа (среднее): 46.77s
Общая стоимость: $0.535

Ранг: #152
Общее число выходных токенов: 1,989
Время ответа (среднее): 4.03s
Общая стоимость: $0.041

Ранг: #163
Общее число выходных токенов: 14,393
Время ответа (среднее): 6.70s
Общая стоимость: $0.164

Рекомендуемая модель GLM 5 (medium)

У него самый высокий балл в этом сравнении (7.7) и лучший общий баланс стоимости и времени ответа среди всех 4 моделей.

Подробное сравнение

Метрика	GLM 5 GLM 5 medium Релиз: 2026-02-12	GLM 5.1 GLM 5.1 medium Релиз: 2026-04-07	GLM 5 GLM 5 none Релиз: 2026-02-12	GLM 5.1 GLM 5.1 none Релиз: 2026-04-07

Метрика	GLM 5 GLM 5 medium Релиз: 2026-02-12	GLM 5.1 GLM 5.1 medium Релиз: 2026-04-07	GLM 5 GLM 5 none Релиз: 2026-02-12	GLM 5.1 GLM 5.1 none Релиз: 2026-04-07
Оценка	7.7	7.1	5.7	5.5
Ранг	#49	#82	#152	#163
Надежность	10.0	8.3	10.0	10.0
Стабильность	8.1	8.4	9.3	8.2
Тестов верно
Доля успешных попыток	78.8%	69.7%	42.4%	40.9%
Нестабильные тесты	4	4	1	5
Всего запусков	63	66	63	66
Стоимость за результат	1.668	4.202	0.263	2.368
Общая стоимость	$0.307	$0.535	$0.041	$0.164
Цена входа	$0.950 / 1M	$0.966 / 1M	$0.950 / 1M	$0.966 / 1M
Цена выхода	$2.551 / 1M	$3.036 / 1M	$2.551 / 1M	$3.036 / 1M
Общее число входных токенов	35,224	82,623	37,135	124,209
Выходные токены	21,570	16,089	1,989	14,393
Токены рассуждений	102,996	136,463	0	0
Время ответа (среднее)	33.54s	46.77s	4.03s	6.70s
Время ответа (макс.)	99.85s	308.75s	11.07s	61.20s
Время ответа (суммарно)	435.99s	982.16s	56.37s	147.38s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#49 GLM 5

medium

Стоимость: $0.005
Время: 20.7s
Токены: 2,068 tok

#82 GLM 5.1

medium

Неверный SVG

Стоимость: $0.000
Время: 300.0s
Токены: 0 tok

#152 GLM 5

none

Стоимость: $0.007
Время: 32.1s
Токены: 2,023 tok

#163 GLM 5.1

none

Неверный SVG

Стоимость: $0.000
Время: 300.0s
Токены: 0 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GLM 5	10.0	10.0	100.0%	0	23.66s	555	480	7,056
GLM 5.1	10.0	10.0	100.0%	0	8.31s	555	401	5,122
GLM 5	4.8	10.0	25.0%	0	2.37s	510	275	0
GLM 5.1	4.0	6.3	25.0%	2	2.11s	555	305	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GLM 5	10.0	10.0	100.0%	0	74.30s	7,254	2,997	52,930
GLM 5.1	4.6	3.7	44.5%	2	109.63s	5,702	4,871	37,826
GLM 5	4.0	7.8	11.1%	1	5.12s	7,256	428	0
GLM 5.1	3.9	9.7	0.0%	0	4.96s	7,256	525	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GLM 5	5.0	5.0	50.0%	0	28.96s	12,804	662	3,242
GLM 5.1	9.8	10.0	100.0%	0	175.93s	66,926	4,761	65,248
GLM 5	1.5	5.0	0.0%	0	4.98s	12,812	406	0
GLM 5.1	2.8	1.8	33.3%	2	46.88s	99,907	12,768	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GLM 5	7.1	5.6	83.3%	1	8.90s	5,508	567	3,734
GLM 5.1	10.0	10.0	100.0%	0	9.33s	7,107	991	4,552
GLM 5	10.0	10.0	100.0%	0	5.78s	7,107	203	0
GLM 5.1	10.0	10.0	100.0%	0	1.08s	7,107	204	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GLM 5	3.5	4.4	33.3%	2	0ms	260	13,176	14,137
GLM 5.1	5.3	10.0	33.3%	0	29.77s	489	969	11,314
GLM 5	3.0	10.0	0.0%	0	2.24s	643	19	0
GLM 5.1	2.9	7.2	11.1%	1	1.99s	687	24	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GLM 5	6.1	3.1	66.7%	1	14.69s	477	2,020	2,248
GLM 5.1	10.0	10.0	100.0%	0	20.95s	477	2,875	2,875
GLM 5	10.0	10.0	100.0%	0	3.27s	477	103	0
GLM 5.1	5.0	10.0	0.0%	0	790ms	477	39	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GLM 5	10.0	10.0	100.0%	0	7.25s	636	1,001	2,129
GLM 5.1	6.4	5.8	66.7%	1	7.47s	634	204	1,617
GLM 5	10.0	10.0	100.0%	0	1.48s	636	61	0
GLM 5.1	9.8	10.0	100.0%	0	1.98s	636	66	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GLM 5	10.0	10.0	100.0%	0	11.33s	609	33	4,076
GLM 5.1	8.2	7.2	88.9%	1	31.64s	609	935	5,730
GLM 5	7.7	10.0	66.7%	0	1.91s	609	261	0
GLM 5.1	7.7	10.0	66.7%	0	1.45s	609	151	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GLM 5	10.0	10.0	100.0%	15.93s	6,935	233	994
GLM 5.1	3.0	10.0	0.0%	0ms	0	0	0
GLM 5	10.0	10.0	100.0%	11.07s	6,899	220	0
GLM 5.1	10.0	10.0	100.0%	10.68s	6,789	300	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GLM 5	3.0	10.0	0.0%	67.37s	186	401	12,450
GLM 5.1	3.0	10.0	0.0%	29.40s	124	82	2,179
GLM 5	3.0	10.0	0.0%	3.62s	186	13	0
GLM 5.1	3.0	10.0	0.0%	2.34s	186	11	0

Быстрое сравнение

Сменить пару сравнения

Nemotron 3 SupermediumБесплатно доступноvsGLM 5none KAT-Coder-Air V2.5mediumvsGLM 5.1none GPT-5.6 LunahighvsGLM 5medium Claude Opus 4.8lowvsGLM 5medium Qwen3.7 PlusnonevsGLM 5.1medium DeepSeek V4 FlashhighvsGLM 5medium DeepSeek V4 ProhighvsGLM 5medium KAT-Coder-Air V2.5highvsGLM 5none KAT-Coder-Air V2.5highvsGLM 5.1none KAT-Coder-Pro V2.5highvsGLM 5.1medium Step 3.7 FlashlowvsGLM 5.1medium Gemini 3.5 FlashnonevsGLM 5.1medium