AI BENCHY Compare

Owl Alpha vs Z.ai: GLM 5 Turbo

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика	Owl Alpha Owl Alpha none Релиз: 2026-04-30	GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15

Метрика	Owl Alpha Owl Alpha none Релиз: 2026-04-30	GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15
Оценка	5.7	5.3
Ранг	#106	#125
Надежность	10.0	10.0
Стабильность	9.2	9.3
Тестов верно
Доля успешных попыток	41.7%	33.3%
Нестабильные тесты	2	2
Всего запусков	60	60
Стоимость за результат	0.000	0.602
Общая стоимость	$0.000	$0.037
???? ?????	$0.000 / 1M	$1.200 / 1M
???? ??????	$0.000 / 1M	$4.000 / 1M
Выходные токены	4,864	1,809
Токены рассуждений	0	0
Время ответа (среднее)	8.84s	2.83s
Время ответа (макс.)	47.10s	8.21s
Время ответа (суммарно)	176.83s	56.58s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Owl Alpha	3.4	7.9	16.7%	1		2.78s	57	0
GLM 5 Turbo	3.0	10.0	0.0%	0		2.84s	382	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Owl Alpha	7.0	9.9	50.0%	0		39.68s	3,629	0
GLM 5 Turbo	4.4	6.7	16.7%	1		2.58s	523	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Owl Alpha	3.0	10.0	0.0%	0		21.74s	315	0
GLM 5 Turbo	3.0	10.0	0.0%	0		4.89s	144	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Owl Alpha	10.0	10.0	100.0%	0		3.60s	246	0
GLM 5 Turbo	10.0	10.0	100.0%	0		2.47s	204	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Owl Alpha	5.3	10.0	33.3%	0		3.00s	27	0
GLM 5 Turbo	5.3	10.0	33.3%	0		1.97s	25	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Owl Alpha	4.3	10.0	0.0%	0		4.61s	80	0
GLM 5 Turbo	4.2	9.9	0.0%	0		2.18s	48	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Owl Alpha	6.4	10.0	50.0%	0		2.63s	63	0
GLM 5 Turbo	6.5	10.0	50.0%	0		2.13s	65	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Owl Alpha	5.9	7.2	55.6%	1		4.43s	202	0
GLM 5 Turbo	5.5	7.4	44.4%	1		2.43s	180	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Owl Alpha	10.0	10.0	100.0%	0		22.78s	231	0
GLM 5 Turbo	10.0	10.0	100.0%	0		8.21s	222	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Owl Alpha	3.0	10.0	0.0%	0		2.50s	14	0
GLM 5 Turbo	3.0	10.0	0.0%	0		2.37s	16	0

Быстрое сравнение

Сменить пару сравнения

CobuddymediumБесплатно доступноvsOwl Alphanone Elephant AlphamediumvsGLM 5 Turbonone Mistral Small 4mediumvsGLM 5 Turbonone MiniMax M2.5mediumБесплатно доступноvsGLM 5 Turbonone gpt-oss-120bmediumБесплатно доступноvsOwl Alphanone Nemotron 3 SupermediumБесплатно доступноvsOwl Alphanone MiniMax M2.7mediumvsGLM 5 Turbonone gpt-oss-120bmediumБесплатно доступноvsGLM 5 Turbonone MiniMax M2.5mediumБесплатно доступноvsOwl Alphanone Mistral Small 4mediumvsOwl Alphanone GPT-5 NanomediumvsOwl Alphanone CobuddymediumБесплатно доступноvsGLM 5 Turbonone