AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Z.ai: GLM 5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-29

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	GLM 5 GLM 5 medium Релиз: 2026-02-12

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	GLM 5 GLM 5 medium Релиз: 2026-02-12
Оценка	9.3	8.2
Ранг	#4	#20
Надежность	10.0	10.0
Стабильность	10.0	8.4
Тестов верно
Доля успешных попыток	90.0%	81.7%
Нестабильные тесты	0	4
Всего запусков	60	60
Стоимость за результат	5.587	1.676
Общая стоимость	$1.006	$0.235
Цена входа	$2.000 / 1M	$0.600 / 1M
Цена выхода	$12.000 / 1M	$1.920 / 1M
Выходные токены	1,971	21,558
Токены рассуждений	75,384	95,772
Время ответа (среднее)	20.77s	32.67s
Время ответа (макс.)	88.68s	99.85s
Время ответа (суммарно)	269.96s	392.01s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	112	3,218
GLM 5	10.0	10.0	100.0%	0		23.66s	480	7,056

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	7.0	9.8	50.0%	0		54.28s	429	37,735
GLM 5	10.0	10.0	100.0%	0		89.47s	2,985	45,706

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	432	9,281
GLM 5	10.0	10.0	100.0%	0		28.96s	662	3,242

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	279	3,904
GLM 5	7.1	5.6	83.3%	1		8.90s	567	3,734

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	18	12,424
GLM 5	3.5	4.4	33.3%	2		0ms	13,176	14,137

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179
GLM 5	6.1	3.1	66.7%	1		14.69s	2,020	2,248

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236
GLM 5	10.0	10.0	100.0%	0		7.25s	1,001	2,129

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.90s	235	3,128
GLM 5	10.0	10.0	100.0%	0		11.33s	33	4,076

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982
GLM 5	10.0	10.0	100.0%	0		15.93s	233	994

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.27s	12	1,297
GLM 5	3.0	10.0	0.0%	0		67.37s	401	12,450

Быстрое сравнение

Сменить пару сравнения

Gemini 3.5 FlashminimalvsGLM 5medium Qwen3.7 MaxnonevsGLM 5medium GPT-5.2 ChatnonevsGLM 5medium Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Gemini 3 Flash PreviewlowvsGLM 5medium Gemini 3 Flash PreviewnonevsGLM 5medium DeepSeek V4 FlashhighБесплатно доступноvsGLM 5medium Gemini 3.1 Flash Lite PreviewlowvsGLM 5medium Gemini 3.5 FlashnonevsGLM 5medium GPT-5.5lowvsGLM 5medium Gemini 3.1 Flash Lite PreviewnonevsGLM 5medium Gemini 3.1 Flash LitelowvsGLM 5medium