AI BENCHY Compare

xAI: Grok 4.20 vs Z.ai: GLM 5 Turbo

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика	Grok 4.20 Grok 4.20 none Релиз: 2026-03-31	GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15

Метрика	Grok 4.20 Grok 4.20 none Релиз: 2026-03-31	GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15
Оценка	5.4	5.3
Ранг	#120	#125
Надежность	Н/Д	10.0
Стабильность	9.5	9.3
Тестов верно
Доля успешных попыток	35.2%	33.3%
Нестабильные тесты	1	2
Всего запусков	54	60
Стоимость за результат	1.574	0.602
Общая стоимость	$0.095	$0.037
???? ?????	$1.250 / 1M	$1.200 / 1M
???? ??????	$2.500 / 1M	$4.000 / 1M
Выходные токены	1,967	1,809
Токены рассуждений	0	0
Время ответа (среднее)	1.11s	2.83s
Время ответа (макс.)	6.04s	8.21s
Время ответа (суммарно)	20.02s	56.58s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Grok 4.20	4.8	10.0	25.0%	0		501ms	267	0
GLM 5 Turbo	3.0	10.0	0.0%	0		2.84s	382	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Grok 4.20	3.4	9.3	0.0%	0		1.22s	312	0
GLM 5 Turbo	4.4	6.7	16.7%	1		2.58s	523	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Grok 4.20	3.0	10.0	0.0%	0		6.04s	282	0
GLM 5 Turbo	3.0	10.0	0.0%	0		4.89s	144	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Grok 4.20	10.0	10.0	100.0%	0		522ms	207	0
GLM 5 Turbo	10.0	10.0	100.0%	0		2.47s	204	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Grok 4.20	3.0	10.0	0.0%	0		687ms	325	0
GLM 5 Turbo	5.3	10.0	33.3%	0		1.97s	25	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Grok 4.20	4.8	10.0	0.0%	0		659ms	83	0
GLM 5 Turbo	4.2	9.9	0.0%	0		2.18s	48	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Grok 4.20	6.3	10.0	50.0%	0		455ms	60	0
GLM 5 Turbo	6.5	10.0	50.0%	0		2.13s	65	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Grok 4.20	5.3	7.2	44.4%	1		487ms	242	0
GLM 5 Turbo	5.5	7.4	44.4%	1		2.43s	180	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Grok 4.20	10.0	10.0	100.0%	0		4.63s	189	0
GLM 5 Turbo	10.0	10.0	100.0%	0		8.21s	222	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Grok 4.20	-	-	-	-	-	-	-	-
GLM 5 Turbo	3.0	10.0	0.0%	0		2.37s	16	0

Быстрое сравнение

Сменить пару сравнения

Mistral Small 4mediumvsGrok 4.20none MiniMax M2.5mediumБесплатно доступноvsGrok 4.20none Elephant AlphamediumvsGrok 4.20none Elephant AlphamediumvsGLM 5 Turbonone Mistral Small 4mediumvsGLM 5 Turbonone MiniMax M2.5mediumБесплатно доступноvsGLM 5 Turbonone gpt-oss-120bmediumБесплатно доступноvsGrok 4.20none MiniMax M2.7mediumvsGLM 5 Turbonone gpt-oss-120bmediumБесплатно доступноvsGLM 5 Turbonone CobuddymediumБесплатно доступноvsGrok 4.20none MiniMax M2.7mediumvsGrok 4.20none CobuddymediumБесплатно доступноvsGLM 5 Turbonone