AI BENCHY Compare

Google: Gemini 3.5 Flash vs Z.ai: GLM 5.2

Сводка

Сравнение benchmark Gemini 3.5 Flash vs GLM 5.2: GLM 5.2 лидирует по среднему баллу: 7.1 vs 7.0. GLM 5.2 имеет более низкую стоимость benchmark: $0.051 vs $1.079. GLM 5.2 быстрее: 6.34s vs 9.93s, с долей успешных попыток 77.8% vs 60.3%.

Рекомендуемая модель: GLM 5.2 - Здесь у него лучший балл (7.1), при этом он примерно в 21.4 раза дешевле, чем Gemini 3.5 Flash.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-02

Метрика	Gemini 3.5 Flash Gemini 3.5 Flash none Релиз: 2026-05-19	GLM 5.2 GLM 5.2 none Релиз: 2026-06-17

Метрика	Gemini 3.5 Flash Gemini 3.5 Flash none Релиз: 2026-05-19	GLM 5.2 GLM 5.2 none Релиз: 2026-06-17
Оценка	7.0	7.1
Ранг	#69	#63
Надежность	10.0	9.9
Стабильность	8.9	9.6
Тестов верно
Доля успешных попыток	77.8%	60.3%
Нестабильные тесты	3	1
Всего запусков	63	63
Стоимость за результат	7.190	0.628
Общая стоимость	$1.079	$0.051
Цена входа	$1.500 / 1M	$0.930 / 1M
Цена выхода	$9.000 / 1M	$3.000 / 1M
Общее число входных токенов	13,843	38,671
Выходные токены	117,518	4,817
Токены рассуждений	0	0
Время ответа (среднее)	9.93s	6.34s
Время ответа (макс.)	64.36s	20.69s
Время ответа (суммарно)	178.68s	133.19s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#69 Gemini 3.5 Flash

none

Стоимость: $0.225
Время: 125.5s
Токены: 25,004 tok

#63 GLM 5.2

none

Неверный SVG

Стоимость: $0.033
Время: 87.7s
Токены: 7,455 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.53s	492	5,101	0
GLM 5.2	8.3	10.0	75.0%	0		3.70s	567	313	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	8.8	7.8	88.9%	1		34.69s	8,122	75,927	0
GLM 5.2	3.7	9.5	0.0%	0		7.55s	7,263	1,958	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0
GLM 5.2	10.0	10.0	100.0%	0		20.69s	14,296	1,489	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	6.5	10.0	50.0%	0		8.10s	2,781	5,895	0
GLM 5.2	10.0	10.0	100.0%	0		7.17s	7,113	204	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	7.6	7.2	77.8%	1		10.64s	633	17,910	0
GLM 5.2	5.3	10.0	33.3%	0		6.50s	696	27	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.46s	486	1,620	0
GLM 5.2	6.1	3.1	66.7%	1		4.42s	480	82	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	9.8	10.0	100.0%	0		3.38s	615	3,928	0
GLM 5.2	9.8	10.0	100.0%	0		3.84s	642	66	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.13s	558	4,640	0
GLM 5.2	7.7	10.0	66.7%	0		3.31s	618	265	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0
GLM 5.2	10.0	10.0	100.0%	0		15.76s	6,807	400	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	2.8	1.6	33.3%	1		4.87s	156	2,497	0
GLM 5.2	3.0	10.0	0.0%	0		3.41s	189	13	0

Быстрое сравнение

Сменить пару сравнения

Gemini 3.5 FlashnonevsKimi K2.7 Codemedium Gemma 4 26B A4BmediumБесплатно доступноvsGLM 5.2none Step 3.7 FlashhighvsGLM 5.2none Gemini 3.5 FlashnonevsLaguna XS 2.1mediumБесплатно доступно Laguna XS 2.1mediumБесплатно доступноvsGLM 5.2none Gemini 3.5 FlashnonevsGLM 5.1medium Gemini 3.5 FlashnonevsStep 3.7 Flashhigh Kimi K2.7 CodemediumvsGLM 5.2none Gemini 3.5 FlashnonevsQwen3.5-Flashmedium Gemini 3.5 FlashnonevsRing-2.6-1Tmedium Grok 4.20mediumvsGLM 5.2none Gemini 3 Flash PreviewlowvsGLM 5.2none