AI BENCHY Compare

Inception: Mercury 2 vs Z.ai: GLM 5 Turbo

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-03

Метрика	Mercury 2 Mercury 2 none Релиз: 2026-02-24	GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15

Метрика	Mercury 2 Mercury 2 none Релиз: 2026-02-24	GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15
Оценка	4.6	5.3
Ранг	#153	#132
Надежность	10.0	10.0
Стабильность	9.1	9.3
Тестов верно
Доля успешных попыток	25.0%	33.3%
Нестабильные тесты	2	2
Всего запусков	60	60
Стоимость за результат	0.216	0.602
Общая стоимость	$0.009	$0.044
Цена входа	$0.250 / 1M	$1.200 / 1M
Цена выхода	$0.750 / 1M	$4.000 / 1M
Общее число входных токенов	25,515	29,927
Выходные токены	3,001	1,809
Токены рассуждений	0	0
Время ответа (среднее)	614ms	2.86s
Время ответа (макс.)	1.27s	8.21s
Время ответа (суммарно)	12.28s	57.24s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mercury 2	3.0	10.0	0.0%	0		483ms	631	286	0
GLM 5 Turbo	3.0	10.0	0.0%	0		2.84s	555	382	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mercury 2	3.5	9.4	0.0%	0		831ms	4,631	1,650	0
GLM 5 Turbo	4.4	6.7	16.7%	1		2.58s	4,658	523	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mercury 2	3.0	10.0	0.0%	0		606ms	4,821	131	0
GLM 5 Turbo	3.0	10.0	0.0%	0		4.89s	8,133	144	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mercury 2	7.3	5.9	83.3%	1		667ms	6,362	180	0
GLM 5 Turbo	10.0	10.0	100.0%	0		2.47s	7,107	204	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mercury 2	5.3	7.2	44.4%	1		534ms	784	46	0
GLM 5 Turbo	5.3	10.0	33.3%	0		1.97s	687	25	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mercury 2	4.8	10.0	0.0%	0		628ms	495	159	0
GLM 5 Turbo	4.2	9.9	0.0%	0		2.18s	477	48	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mercury 2	6.5	10.0	50.0%	0		551ms	691	82	0
GLM 5 Turbo	6.5	10.0	50.0%	0		2.13s	636	65	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mercury 2	3.1	10.0	0.0%	0		535ms	694	251	0
GLM 5 Turbo	5.5	7.4	44.4%	1		2.65s	609	180	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mercury 2	10.0	10.0	100.0%	0		1.27s	6,193	197	0
GLM 5 Turbo	10.0	10.0	100.0%	0		8.21s	6,879	222	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Mercury 2	3.0	10.0	0.0%	0		548ms	213	19	0
GLM 5 Turbo	3.0	10.0	0.0%	0		2.37s	186	16	0

Быстрое сравнение

Сменить пару сравнения

Elephant AlphamediumvsGLM 5 Turbonone Mistral Small 4mediumvsGLM 5 Turbonone MiniMax M2.7mediumvsGLM 5 Turbonone Mercury 2nonevsQwen3 Coder Nextmedium Mercury 2nonevsGLM 4.7 Flashmedium MiniMax M2.5mediumvsGLM 5 Turbonone Mercury 2nonevsQwen3.5-9Bmedium CobuddymediumvsGLM 5 Turbonone Owl AlphamediumvsGLM 5 Turbonone Qwen3 Coder NextmediumvsGLM 5 Turbonone gpt-oss-120bmediumБесплатно доступноvsGLM 5 Turbonone Nemotron 3 SupermediumБесплатно доступноvsGLM 5 Turbonone