AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs Z.ai: GLM 5

Сводка

Claude Opus 4.7 (medium) лидирует по среднему баллу: 8.7 vs 8.6. GLM 5 (medium) имеет более низкую стоимость benchmark: $0.228 vs $0.679. Claude Opus 4.7 (medium) быстрее: 4.73s vs 33.54s, с долей успешных попыток 82.5% vs 82.5%.

Рекомендуемая модельClaude Opus 4.7 (medium)Здесь у него лучший балл (8.7), и он отвечает примерно в 7.1 раза быстрее, чем GLM 5 (medium).

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-14

Метрика	Claude Opus 4.7 Claude Opus 4.7 medium Релиз: 2026-04-16	GLM 5 GLM 5 medium Релиз: 2026-02-12

Метрика	Claude Opus 4.7 Claude Opus 4.7 medium Релиз: 2026-04-16	GLM 5 GLM 5 medium Релиз: 2026-02-12
Оценка	8.7	8.6
Ранг	#16	#18
Надежность	10.0	10.0
Стабильность	9.6	8.5
Тестов верно
Доля успешных попыток	82.5%	82.5%
Нестабильные тесты	1	4
Всего запусков	63	63
Стоимость за результат	3.991	1.668
Общая стоимость	$0.679	$0.228
Цена входа	$5.000 / 1M	$0.600 / 1M
Цена выхода	$25.000 / 1M	$1.920 / 1M
Общее число входных токенов	65,406	35,224
Выходные токены	11,858	21,570
Токены рассуждений	2,198	102,996
Время ответа (среднее)	4.73s	33.54s
Время ответа (макс.)	23.18s	99.85s
Время ответа (суммарно)	94.51s	435.99s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#16 Claude Opus 4.7

medium

Стоимость: $0.059
Время: 26.8s
Токены: 2,475 tok

#18 GLM 5

medium

Стоимость: $0.005
Время: 20.7s
Токены: 2,068 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	894	348	0
GLM 5	10.0	10.0	100.0%	0		23.66s	555	480	7,056

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	7.6	7.2	77.8%	1		12.96s	10,635	7,629	1,114
GLM 5	10.0	10.0	100.0%	0		74.30s	7,254	2,997	52,930

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		21.45s	24,501	2,369	1,084
GLM 5	10.0	10.0	100.0%	0		28.96s	12,804	662	3,242

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	10,533	324	0
GLM 5	7.1	5.6	83.3%	1		8.90s	5,508	567	3,734

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	630	51	0
GLM 5	3.5	4.4	33.3%	2		0ms	260	13,176	14,137

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	723	256	0
GLM 5	6.1	3.1	66.7%	1		14.69s	477	2,020	2,248

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	939	114	0
GLM 5	10.0	10.0	100.0%	0		7.25s	636	1,001	2,129

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		2.43s	939	370	0
GLM 5	10.0	10.0	100.0%	0		11.33s	609	33	4,076

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	15,339	373	0
GLM 5	10.0	10.0	100.0%	0		15.93s	6,935	233	994

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	273	24	0
GLM 5	3.0	10.0	0.0%	0		67.37s	186	401	12,450

Быстрое сравнение

Сменить пару сравнения

GPT-5.2 ChatnonevsGLM 5medium Claude Opus 4.7mediumvsGPT-5.2 Chatnone DeepSeek V4 FlashhighvsGLM 5medium GPT-5.6 TerrahighvsGLM 5medium Claude Opus 4.7mediumvsDeepSeek V4 Flashhigh Claude Opus 4.7mediumvsGPT-5.6 Terrahigh Claude Opus 4.7mediumvsGemini 3.5 Flashlow KAT-Coder-Pro V2.5lowvsGLM 5medium Claude Opus 4.7mediumvsGPT-5.5low Claude Opus 4.7mediumvsGPT-5.6 Solhigh Claude Opus 4.7mediumvsGLM 5.2high Gemini 3.5 FlashlowvsGLM 5medium