AI BENCHY Compare

Elephant vs Z.ai: GLM 5 Turbo

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-14

Метрика	Elephant Elephant none Релиз: 2026-04-14	GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15

Метрика	Elephant Elephant none Релиз: 2026-04-14	GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15
Оценка	5.2	5.5
Ранг	#81	#73
Стабильность	9.6	9.2
Тестов верно
Доля успешных попыток	31.5%	37.0%
Нестабильные тесты	1	2
Всего запусков	54	54
Стоимость за результат	0.000	0.518
Общая стоимость	$0.000	$0.032
???? ?????	$0.000 / 1M	$1.200 / 1M
???? ??????	$0.000 / 1M	$4.000 / 1M
Выходные токены	2,573	1,775
Токены рассуждений	0	0
Время ответа (среднее)	1.23s	2.94s
Время ответа (макс.)	3.81s	8.21s
Время ответа (суммарно)	22.16s	52.98s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant	6.6	10.0	50.0%	0		963ms	610	0
GLM 5 Turbo	3.0	10.0	0.0%	0		2.84s	382	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant	6.4	3.3	66.7%	1		1.39s	375	0
GLM 5 Turbo	5.3	3.4	33.3%	1		3.93s	505	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant	3.0	10.0	0.0%	0		3.81s	731	0
GLM 5 Turbo	3.0	10.0	0.0%	0		4.89s	144	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant	6.5	10.0	50.0%	0		1.04s	246	0
GLM 5 Turbo	10.0	10.0	100.0%	0		2.47s	204	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant	3.0	10.0	0.0%	0		927ms	24	0
GLM 5 Turbo	5.3	10.0	33.3%	0		1.97s	25	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant	4.0	10.0	0.0%	0		854ms	106	0
GLM 5 Turbo	4.2	9.9	0.0%	0		2.18s	48	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant	9.8	10.0	100.0%	0		1.03s	81	0
GLM 5 Turbo	6.5	10.0	50.0%	0		2.13s	65	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant	3.3	10.0	0.0%	0		849ms	170	0
GLM 5 Turbo	5.5	7.4	44.4%	1		2.43s	180	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant	3.0	10.0	0.0%	0		2.79s	230	0
GLM 5 Turbo	10.0	10.0	100.0%	0		8.21s	222	0

Быстрое сравнение

Сменить пару сравнения

MiniMax M2.7mediumvsElephantnone Mistral Small 4mediumvsGLM 5 Turbonone MiniMax M2.5mediumБесплатно доступноvsGLM 5 Turbonone MiniMax M2.7mediumvsGLM 5 Turbonone ElephantmediumvsGLM 5 Turbonone gpt-oss-120bmediumБесплатно доступноvsGLM 5 Turbonone Mistral Small 4mediumvsElephantnone ElephantnonevsQwen3 Coder Nextmedium MiniMax M2.5mediumБесплатно доступноvsElephantnone ElephantnonevsGLM 4.7 Flashmedium gpt-oss-120bmediumБесплатно доступноvsElephantnone GPT-5 NanomediumvsGLM 5 Turbonone