AI BENCHY Compare

Hunter Alpha vs Z.ai: GLM 5.1

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-07

Метрика	Hunter Alpha Hunter Alpha none Релиз: 2026-03-11	GLM 5.1 GLM 5.1 none Релиз: 2026-04-07

Метрика	Hunter Alpha Hunter Alpha none Релиз: 2026-03-11	GLM 5.1 GLM 5.1 none Релиз: 2026-04-07
Оценка	5.9	5.6
Ранг	#64	#67
Стабильность	8.1	8.2
Тестов верно
Доля успешных попыток	49.0%	39.2%
Нестабильные тесты	4	4
Всего запусков	51	51
Стоимость за результат	0.000	1.000
Общая стоимость	$0.000	$0.050
???? ?????	$0.000 / 1M	$1.000 / 1M
???? ??????	$0.000 / 1M	$3.200 / 1M
Выходные токены	2,278	3,219
Токены рассуждений	0	0
Время ответа (среднее)	4.58s	4.01s
Время ответа (макс.)	15.17s	32.57s
Время ответа (суммарно)	77.92s	68.23s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	3.5	8.0	16.7%	1		3.81s	779	0
GLM 5.1	4.0	6.3	25.0%	2		2.11s	305	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	3.0	10.0	0.0%	0		15.17s	379	0
GLM 5.1	2.8	2.1	33.3%	1		32.57s	2,129	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	10.0	10.0	100.0%	0		8.49s	249	0
GLM 5.1	10.0	10.0	100.0%	0		1.08s	204	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	5.3	10.0	33.3%	0		2.33s	27	0
GLM 5.1	2.9	7.2	11.1%	1		1.99s	24	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	6.1	3.1	66.7%	1		2.71s	91	0
GLM 5.1	5.0	10.0	0.0%	0		790ms	39	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	6.4	10.0	50.0%	0		2.82s	69	0
GLM 5.1	8.3	10.0	50.0%	0		1.58s	66	0

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	5.8	4.4	66.7%	2		3.06s	349	0
GLM 5.1	5.7	10.0	33.3%	0		1.48s	152	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	10.0	10.0	100.0%	0		6.02s	335	0
GLM 5.1	10.0	10.0	100.0%	0		10.68s	300	0

Быстрое сравнение

Сменить пару сравнения

MiniMax M2.5mediumБесплатно доступноvsHunter Alphanone Mistral Small 4mediumvsGLM 5.1none gpt-oss-120bmediumБесплатно доступноvsHunter Alphanone MiniMax M2.5mediumБесплатно доступноvsGLM 5.1none Mistral Small 4mediumvsHunter Alphanone gpt-oss-120bmediumБесплатно доступноvsGLM 5.1none Hunter AlphanonevsGrok 4.20 Multi Agent Betamedium GPT-5 NanomediumvsHunter Alphanone Mercury 2mediumvsHunter Alphanone Grok 4.20 Multi Agent BetamediumvsGLM 5.1none GPT-5 NanomediumvsGLM 5.1none MiniMax M2.7mediumvsGLM 5.1none