AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Z.ai: GLM 5.1

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-07

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	GLM 5.1 GLM 5.1 medium Релиз: 2026-04-07

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	GLM 5.1 GLM 5.1 medium Релиз: 2026-04-07
Оценка	9.6	8.0
Ранг	#2	#23
Стабильность	10.0	9.0
Тестов верно
Доля успешных попыток	94.1%	76.5%
Нестабильные тесты	0	2
Всего запусков	51	51
Стоимость за результат	3.257	1.270
Общая стоимость	$0.522	$0.153
???? ?????	$2.000 / 1M	$1.000 / 1M
???? ??????	$12.000 / 1M	$3.200 / 1M
Выходные токены	1,527	6,666
Токены рассуждений	36,341	35,313
Время ответа (среднее)	15.56s	18.23s
Время ответа (макс.)	40.61s	43.11s
Время ответа (суммарно)	155.64s	291.73s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	112	3,218
GLM 5.1	10.0	10.0	100.0%	0		8.31s	401	5,122

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	432	9,281
GLM 5.1	9.5	10.0	100.0%	0		43.11s	327	4,206

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	279	3,904
GLM 5.1	10.0	10.0	100.0%	0		9.33s	991	4,552

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	18	12,424
GLM 5.1	5.3	10.0	33.3%	0		29.77s	969	11,314

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179
GLM 5.1	10.0	10.0	100.0%	0		20.95s	2,875	2,875

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236
GLM 5.1	6.4	5.8	66.7%	1		7.47s	204	1,617

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117
GLM 5.1	8.2	7.2	88.9%	1		23.85s	899	5,627

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982
GLM 5.1	3.0	10.0	0.0%	0		0ms	0	0

Быстрое сравнение

Сменить пару сравнения

Gemini 3 Flash PreviewnonevsGLM 5.1medium Gemini 3.1 Flash Lite PreviewlowvsGLM 5.1medium Gemini 3.1 Flash Lite PreviewnonevsGLM 5.1medium GPT-5.2 ChatnonevsGLM 5.1medium GPT-5.3 ChatnonevsGLM 5.1medium Gemini 3 Flash PreviewlowvsGLM 5.1medium Claude Sonnet 4.6nonevsGLM 5.1medium Qwen3.5 Plus 2026-02-15nonevsGLM 5.1medium Gemma 4 31BnoneБесплатно доступноvsGLM 5.1medium MiMo-V2-OmninonevsGLM 5.1medium DeepSeek V3.2nonevsGLM 5.1medium Gemini 3.1 Pro PreviewmediumvsGPT-5.2 Chatnone