AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Z.ai: GLM 5 Turbo

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-15

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15
Ранг	#2	#53
Оценка	9.5	5.7
Стабильность	10.0	9.5
Стоимость за результат	3.417	0.467
Общая стоимость	$0.513	$0.028
Тестов верно
Доля успешных попыток	93.8%	39.6%
Нестабильные тесты	0	1
Всего запусков	48	48
Выходные токены	1,521	1,264
Токены рассуждений	35,656	0
Время ответа (среднее)	16.60s	2.92s
Время ответа (макс.)	40.61s	8.21s
Время ответа (суммарно)	149.36s	46.72s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.52s	106	2,533
GLM 5 Turbo	3.0	10.0	0.0%	0		3.01s	376	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	432	9,281
GLM 5 Turbo	3.0	10.0	0.0%	0		4.89s	144	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	279	3,904
GLM 5 Turbo	10.0	10.0	100.0%	0		2.47s	204	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	18	12,424
GLM 5 Turbo	5.3	10.0	33.3%	0		1.97s	25	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179
GLM 5 Turbo	4.2	9.9	0.0%	0		2.18s	48	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236
GLM 5 Turbo	6.5	10.0	50.0%	0		2.13s	65	0

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117
GLM 5 Turbo	5.5	7.4	44.4%	1		2.43s	180	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982
GLM 5 Turbo	10.0	10.0	100.0%	0		8.21s	222	0

Быстрое сравнение

Сменить пару сравнения

MiniMax M2.5mediumБесплатно доступноvsGLM 5 Turbonone Grok 4.20 Multi-Agent BetamediumvsGLM 5 Turbonone gpt-oss-120bmediumБесплатно доступноvsGLM 5 Turbonone GPT-5 NanomediumvsGLM 5 Turbonone Mercury 2mediumvsGLM 5 Turbonone Qwen3 Coder NextmediumvsGLM 5 Turbonone Nemotron 3 Super 120b A12bmediumБесплатно доступноvsGLM 5 Turbonone Qwen3.5-9BmediumvsGLM 5 Turbonone GPT-5 MinimediumvsGLM 5 Turbonone Grok 4.1 FastmediumvsGLM 5 Turbonone Qwen3.5-35B-A3BmediumvsGLM 5 Turbonone Hunter AlphamediumvsGLM 5 Turbonone