Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.5 Flash vs Z.ai: GLM 5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-19

Метрика Gemini 3.5 Flash Gemini 3.5 Flash high Релиз: 2026-05-19 GLM 5 GLM 5 medium Релиз: 2026-02-12
Оценка 9.6 8.1
Ранг #4 #24
Надежность 10.0 10.0
Стабильность 9.6 8.3
Тестов верно
Доля успешных попыток 96.5% 80.7%
Нестабильные тесты 1 4
Всего запусков 57 57
Стоимость за результат 4.294 1.379
Общая стоимость $0.773 $0.180
???? ????? $1.500 / 1M $0.600 / 1M
???? ?????? $9.000 / 1M $1.920 / 1M
Выходные токены 1,945 20,564
Токены рассуждений 78,877 70,787
Время ответа (среднее) 6.90s 27.34s
Время ответа (макс.) 22.37s 79.09s
Время ответа (суммарно) 131.10s 300.78s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.57s 174 4,997
GLM 5 10.0 10.0 100.0% 0 23.66s 480 7,056
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 14.42s 426 10,368
GLM 5 10.0 10.0 100.0% 0 79.09s 330 19,814
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.37s 351 16,323
GLM 5 10.0 10.0 100.0% 0 28.96s 662 3,242
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.43s 279 8,466
GLM 5 7.1 5.6 83.3% 1 8.90s 567 3,734
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 7.6 7.2 77.8% 1 14.09s 12 24,721
GLM 5 3.5 4.4 33.3% 2 0ms 13,176 14,137
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.63s 115 1,650
GLM 5 6.1 3.1 66.7% 1 14.69s 2,020 2,248
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.35s 70 3,799
GLM 5 10.0 10.0 100.0% 0 7.25s 1,001 2,129
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.23s 241 4,940
GLM 5 10.0 10.0 100.0% 0 15.64s 1,694 4,983
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 9.8 10.0 100.0% 0 4.96s 265 1,608
GLM 5 10.0 10.0 100.0% 0 15.93s 233 994
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.94s 12 2,005
GLM 5 3.0 10.0 0.0% 0 67.37s 401 12,450

Быстрое сравнение

Сменить пару сравнения