Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.5 Flash vs Z.ai: GLM 5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-19

Метрика Gemini 3.5 Flash Gemini 3.5 Flash minimal Релиз: 2026-05-19 GLM 5 GLM 5 medium Релиз: 2026-02-12
Оценка 8.1 8.1
Ранг #21 #24
Надежность 10.0 10.0
Стабильность 9.6 8.3
Тестов верно
Доля успешных попыток 75.4% 80.7%
Нестабильные тесты 1 4
Всего запусков 57 57
Стоимость за результат 0.494 1.379
Общая стоимость $0.070 $0.180
???? ????? $1.500 / 1M $0.600 / 1M
???? ?????? $9.000 / 1M $1.920 / 1M
Выходные токены 2,262 20,564
Токены рассуждений 0 70,787
Время ответа (среднее) 1.37s 27.34s
Время ответа (макс.) 3.56s 79.09s
Время ответа (суммарно) 26.04s 300.78s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 6.5 10.0 50.0% 0 892ms 405 0
GLM 5 10.0 10.0 100.0% 0 23.66s 480 7,056
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.28s 441 0
GLM 5 10.0 10.0 100.0% 0 79.09s 330 19,814
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 3.0 10.0 0.0% 0 3.56s 404 0
GLM 5 10.0 10.0 100.0% 0 28.96s 662 3,242
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.66s 279 0
GLM 5 7.1 5.6 83.3% 1 8.90s 567 3,734
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 899ms 12 0
GLM 5 3.5 4.4 33.3% 2 0ms 13,176 14,137
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 922ms 117 0
GLM 5 6.1 3.1 66.7% 1 14.69s 2,020 2,248
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 6.4 5.8 66.7% 1 893ms 76 0
GLM 5 10.0 10.0 100.0% 0 7.25s 1,001 2,129
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.45s 282 0
GLM 5 10.0 10.0 100.0% 0 15.64s 1,694 4,983
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.79s 234 0
GLM 5 10.0 10.0 100.0% 0 15.93s 233 994
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 3.0 10.0 0.0% 0 1.76s 12 0
GLM 5 3.0 10.0 0.0% 0 67.37s 401 12,450

Быстрое сравнение

Сменить пару сравнения