AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs Z.ai: GLM 5 Turbo

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite high Релиз: 2026-05-08	GLM 5 Turbo GLM 5 Turbo medium Релиз: 2026-03-15

Метрика	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite high Релиз: 2026-05-08	GLM 5 Turbo GLM 5 Turbo medium Релиз: 2026-03-15
Оценка	7.5	7.9
Ранг	#48	#28
Надежность	9.8	8.3
Стабильность	8.1	8.1
Тестов верно
Доля успешных попыток	74.1%	76.7%
Нестабильные тесты	4	5
Всего запусков	54	60
Стоимость за результат	18.579	1.872
Общая стоимость	$2.044	$0.244
???? ?????	$0.250 / 1M	$1.200 / 1M
???? ??????	$1.500 / 1M	$4.000 / 1M
Выходные токены	1,984	12,231
Токены рассуждений	1,355,583	53,558
Время ответа (среднее)	61.96s	22.69s
Время ответа (макс.)	149.23s	194.23s
Время ответа (суммарно)	1115.31s	453.72s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	9.4	10.0	100.0%	0		37.16s	100	130,598
GLM 5 Turbo	10.0	10.0	100.0%	0		4.82s	362	3,137

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		137.63s	666	188,733
GLM 5 Turbo	7.3	5.8	83.3%	1		53.92s	346	16,607

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		149.23s	327	198,243
GLM 5 Turbo	10.0	10.0	100.0%	0		13.88s	390	2,037

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		4.49s	279	7,351
GLM 5 Turbo	10.0	10.0	100.0%	0		6.19s	577	3,632

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	3.6	7.2	22.2%	1		139.90s	18	566,210
GLM 5 Turbo	2.9	4.4	22.2%	2		71.07s	9,665	19,279

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	5.0	2.1	66.7%	1		45.69s	95	64,644
GLM 5 Turbo	6.1	3.1	66.7%	1		10.05s	60	2,216

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	7.3	5.8	83.3%	1		23.26s	52	3,549
GLM 5 Turbo	10.0	10.0	100.0%	0		5.38s	255	2,183

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	5.7	6.8	44.4%	1		50.83s	213	193,654
GLM 5 Turbo	8.7	7.9	77.8%	1		5.44s	315	2,702

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		6.44s	234	2,601
GLM 5 Turbo	10.0	10.0	100.0%	0		9.84s	241	446

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	-	-	-	-	-	-	-	-
GLM 5 Turbo	3.0	10.0	0.0%	0		40.17s	20	1,319

Быстрое сравнение

Сменить пару сравнения

Qwen3.7 MaxnonevsGLM 5 Turbomedium Gemini 3.5 FlashminimalvsGLM 5 Turbomedium Gemini 3 Flash PreviewnonevsGLM 5 Turbomedium Gemini 3.1 Flash Lite PreviewlowvsGLM 5 Turbomedium GPT-5.2 ChatnonevsGLM 5 Turbomedium Gemini 3.1 Flash Lite PreviewnonevsGLM 5 Turbomedium Gemini 3.1 Flash LitelowvsGLM 5 Turbomedium GPT-5.3 ChatnonevsGLM 5 Turbomedium DeepSeek V4 FlashhighБесплатно доступноvsGLM 5 Turbomedium Ring-2.6-1TnonevsGLM 5 Turbomedium Gemini 3 Flash PreviewlowvsGLM 5 Turbomedium Qwen3.6 Max PreviewnonevsGLM 5 Turbomedium