Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemma 4 31B vs Z.ai: GLM 5 Turbo

Сводка

Сравнение benchmark Gemma 4 31B vs GLM 5 Turbo: Gemma 4 31B лидирует по среднему баллу: 6.3 vs 5.3. Gemma 4 31B имеет более низкую стоимость benchmark: $0.033 vs $0.047. GLM 5 Turbo быстрее: 2.82s vs 56.55s, с долей успешных попыток 69.8% vs 31.8%.

Рекомендуемая модель: GLM 5 Turbo - Он дает лучший общий компромисс: конкурентный балл (5.3), быстрее ответ, чем у Gemma 4 31B, и сбалансированная стоимость.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-12

Метрика Gemma 4 31B Gemma 4 31B medium Релиз: 2026-04-02 Бесплатно доступно GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15
Оценка 6.3 5.3
Ранг #87 #128
Надежность 10.0 10.0
Стабильность 9.4 9.3
Тестов верно
Доля успешных попыток 69.8% 31.8%
Нестабильные тесты 1 2
Всего запусков 63 63
Стоимость за результат 0.257 0.655
Общая стоимость $0.033 $0.047
Цена входа $0.120 / 1M $1.200 / 1M
Цена выхода $0.350 / 1M $4.000 / 1M
Общее число входных токенов 17,957 32,525
Выходные токены 22,356 1,815
Токены рассуждений 65,726 0
Время ответа (среднее) 56.55s 2.82s
Время ответа (макс.) 437.40s 8.21s
Время ответа (суммарно) 1074.41s 59.29s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#87 Gemma 4 31B

medium
Cost
$0.002
Time
45.7s
Tokens
2,696 tok

#128 GLM 5 Turbo

none
Cost
$0.047
Time
129.2s
Tokens
11,775 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 816 962 2,046
GLM 5 Turbo 3.0 10.0 0.0% 0 2.84s 555 382 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemma 4 31B 4.3 5.8 22.2% 1 219.76s 5,568 11,098 33,212
GLM 5 Turbo 3.9 7.8 11.1% 1 2.41s 7,256 529 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
GLM 5 Turbo 3.0 10.0 0.0% 0 4.89s 8,133 144 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 8,334 1,822 2,951
GLM 5 Turbo 10.0 10.0 100.0% 0 2.47s 7,107 204 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 876 4,349 8,985
GLM 5 Turbo 5.3 10.0 33.3% 0 1.97s 687 25 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 567 105 888
GLM 5 Turbo 4.2 9.9 0.0% 0 2.18s 477 48 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 777 533 2,035
GLM 5 Turbo 6.5 10.0 50.0% 0 2.13s 636 65 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemma 4 31B 9.9 10.0 100.0% 0 26.91s 801 1,795 5,595
GLM 5 Turbo 5.5 7.4 44.4% 1 2.65s 609 180 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
GLM 5 Turbo 10.0 10.0 100.0% 0 8.21s 6,879 222 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 218 1,692 10,014
GLM 5 Turbo 3.0 10.0 0.0% 0 2.37s 186 16 0

Быстрое сравнение

Сменить пару сравнения