AI BENCHY Compare

Laguna Xs.2 vs Z.ai: GLM 5.1

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-29

Метрика	Laguna Xs.2 Laguna Xs.2 medium Релиз: 2026-04-28 Бесплатно доступно	GLM 5.1 GLM 5.1 none Релиз: 2026-04-07

Метрика	Laguna Xs.2 Laguna Xs.2 medium Релиз: 2026-04-28 Бесплатно доступно	GLM 5.1 GLM 5.1 none Релиз: 2026-04-07
Оценка	6.2	5.6
Ранг	#81	#98
Надежность	10.0	Н/Д
Стабильность	6.9	8.2
Тестов верно
Доля успешных попыток	57.4%	37.0%
Нестабильные тесты	7	4
Всего запусков	54	54
Стоимость за результат	0.000	1.046
Общая стоимость	$0.000	$0.053
???? ?????	$0.000 / 1M	$1.050 / 1M
???? ??????	$0.000 / 1M	$3.500 / 1M
Выходные токены	58,141	3,720
Токены рассуждений	0	0
Время ответа (среднее)	6.03s	4.33s
Время ответа (макс.)	29.11s	32.57s
Время ответа (суммарно)	108.59s	78.02s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna Xs.2	7.4	5.9	83.3%	2		2.60s	5,283	0
GLM 5.1	4.0	6.3	25.0%	2		2.11s	305	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna Xs.2	6.3	3.7	33.3%	1		14.36s	7,896	0
GLM 5.1	5.1	9.1	0.0%	0		9.79s	501	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna Xs.2	3.0	10.0	0.0%	0		15.92s	8,501	0
GLM 5.1	2.8	2.1	33.3%	1		32.57s	2,129	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna Xs.2	7.1	5.6	83.3%	1		9.34s	10,472	0
GLM 5.1	10.0	10.0	100.0%	0		1.08s	204	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna Xs.2	4.1	4.4	44.5%	2		11.12s	18,712	0
GLM 5.1	2.9	7.2	11.1%	1		1.99s	24	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna Xs.2	4.1	10.0	0.0%	0		2.76s	1,421	0
GLM 5.1	5.0	10.0	0.0%	0		790ms	39	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna Xs.2	10.0	10.0	100.0%	0		1.68s	1,517	0
GLM 5.1	8.3	10.0	50.0%	0		1.58s	66	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna Xs.2	5.3	10.0	33.3%	0		2.12s	3,168	0
GLM 5.1	5.7	10.0	33.3%	0		1.48s	152	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna Xs.2	4.7	1.6	66.7%	1		3.39s	1,171	0
GLM 5.1	10.0	10.0	100.0%	0		10.68s	300	0

Быстрое сравнение

Сменить пару сравнения

Gemini 2.5 FlashnonevsLaguna Xs.2mediumБесплатно доступно Seed-2.0-LitenonevsLaguna Xs.2mediumБесплатно доступно Gemma 4 26B A4BnoneБесплатно доступноvsLaguna Xs.2mediumБесплатно доступно Laguna Xs.2mediumБесплатно доступноvsQwen3.5-35B-A3Bnone Laguna Xs.2mediumБесплатно доступноvsQwen3.5-Flashnone Laguna Xs.2mediumБесплатно доступноvsGLM 5V Turbonone Mistral Small 4mediumvsGLM 5.1none MiniMax M2.5mediumБесплатно доступноvsGLM 5.1none Laguna Xs.2mediumБесплатно доступноvsQwen3.6 27Bnone DeepSeek V3.2nonevsLaguna Xs.2mediumБесплатно доступно Laguna Xs.2mediumБесплатно доступноvsMiMo-V2-Pronone GPT-5.4nonevsLaguna Xs.2mediumБесплатно доступно