AI BENCHY Compare

Сравниваемые модели

Сводка

Бенчмарк-сравнение Gemma 4 31B vs Gemini 3 PRO Preview vs GLM 5 TurboGLM 5 Turbo лидирует по Оценка со значением 8.4. Gemma 4 31B лидирует по Надежность со значением 10.0. У Gemma 4 31B самый низкий Общая стоимость: $0.033. Gemini 3 PRO Preview самый быстрый: 9.05s.

Рекомендуемая модель: GLM 5 Turbo - У него самый высокий балл в этом сравнении (8.4) и лучший общий баланс стоимости и времени ответа среди всех 3 моделей.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-02

Метрика	Gemma 4 31B Gemma 4 31B medium Релиз: 2026-04-02 Бесплатно доступно	Gemini 3 PRO Preview Gemini 3 PRO Preview medium Релиз: 2025-11-18	GLM 5 Turbo GLM 5 Turbo medium Релиз: 2026-03-15

Метрика	Gemma 4 31B Gemma 4 31B medium Релиз: 2026-04-02 Бесплатно доступно	Gemini 3 PRO Preview Gemini 3 PRO Preview medium Релиз: 2025-11-18	GLM 5 Turbo GLM 5 Turbo medium Релиз: 2026-03-15
Оценка	6.3	6.2	8.4
Ранг	#91	#94	#21
Надежность	10.0	Н/Д	10.0
Стабильность	9.4	10.0	8.5
Тестов верно
Доля успешных попыток	69.8%	66.7%	74.6%
Нестабильные тесты	1	0	4
Всего запусков	63	63	63
Стоимость за результат	0.257	1.406	2.011
Общая стоимость	$0.033	$0.385	$0.323
Цена входа	$0.120 / 1M	$9.506 / 1M	$1.200 / 1M
Цена выхода	$0.350 / 1M	$9.506 / 1M	$4.000 / 1M
Общее число входных токенов	17,957	28,848	35,593
Выходные токены	22,356	1,490	12,245
Токены рассуждений	65,726	10,102	62,277
Время ответа (среднее)	56.55s	9.05s	23.00s
Время ответа (макс.)	437.40s	26.24s	194.23s
Время ответа (суммарно)	1074.41s	90.53s	482.97s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#91 Gemma 4 31B

medium

Стоимость: $0.002
Время: 45.7s
Токены: 2,696 tok

#94 Gemini 3 PRO Preview

medium

No endpoints found for google/gemini-3-pro-preview.

Стоимость: $0.000
Время: 0.1s
Токены: 0 tok

#21 GLM 5 Turbo

medium

Стоимость: $0.074
Время: 206.0s
Токены: 18,549 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemma 4 31B	10.0	10.0	100.0%	12.89s	816	962	2,046
Gemini 3 PRO Preview	10.0	10.0	100.0%	14.99s	500	149	1,485
GLM 5 Turbo	10.0	10.0	100.0%	4.82s	555	362	3,137

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemma 4 31B	4.3	5.8	22.2%	1	219.76s	5,568	11,098	33,212
Gemini 3 PRO Preview	3.0	10.0	0.0%	0	0ms	0	0	0
GLM 5 Turbo	8.2	9.3	66.7%	0	45.90s	5,941	363	25,381

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemma 4 31B	3.0	10.0	0.0%	0ms	0	0	0
Gemini 3 PRO Preview	3.0	10.0	0.0%	10.37s	13,211	351	952
GLM 5 Turbo	10.0	10.0	100.0%	13.88s	12,714	390	2,037

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemma 4 31B	10.0	10.0	100.0%	21.11s	8,334	1,822	2,951
Gemini 3 PRO Preview	10.0	10.0	100.0%	10.84s	7,259	279	3,156
GLM 5 Turbo	10.0	10.0	100.0%	6.19s	7,107	577	3,632

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemma 4 31B	7.7	10.0	66.7%	0	38.48s	876	4,349	8,985
Gemini 3 PRO Preview	5.3	10.0	33.3%	0	7.01s	643	15	1,195
GLM 5 Turbo	2.9	4.4	22.2%	2	71.07s	489	9,665	19,279

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemma 4 31B	10.0	10.0	100.0%	0	9.57s	567	105	888
Gemini 3 PRO Preview	10.0	10.0	100.0%	0	9.34s	486	78	374
GLM 5 Turbo	6.1	3.1	66.7%	1	10.05s	477	60	2,216

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemma 4 31B	10.0	10.0	100.0%	12.76s	777	533	2,035
Gemini 3 PRO Preview	9.8	10.0	100.0%	3.26s	623	69	754
GLM 5 Turbo	10.0	10.0	100.0%	5.38s	636	255	2,183

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemma 4 31B	9.9	10.0	100.0%	0	26.91s	801	1,795	5,595
Gemini 3 PRO Preview	10.0	10.0	100.0%	0	3.88s	570	225	1,215
GLM 5 Turbo	8.7	7.9	77.8%	1	5.23s	609	312	2,647

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemma 4 31B	3.0	10.0	0.0%	0ms	0	0	0
Gemini 3 PRO Preview	10.0	10.0	100.0%	11.96s	5,556	324	971
GLM 5 Turbo	10.0	10.0	100.0%	9.84s	6,879	241	446

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemma 4 31B	3.0	10.0	0.0%	90.14s	218	1,692	10,014
Gemini 3 PRO Preview	3.0	10.0	0.0%	0ms	0	0	0
GLM 5 Turbo	3.0	10.0	0.0%	40.17s	186	20	1,319

Быстрое сравнение

Сменить пару сравнения