Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Z.ai: GLM 5V Turbo

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-10

Метрика Gemini 3 Flash Preview Gemini 3 Flash Preview medium Релиз: 2025-12-17 GLM 5V Turbo GLM 5V Turbo none Релиз: 2026-04-01
Оценка 10.0 6.0
Ранг #1 #89
Надежность 10.0 10.0
Стабильность 10.0 10.0
Тестов верно
Доля успешных попыток 100.0% 42.1%
Нестабильные тесты 0 0
Всего запусков 57 57
Стоимость за результат 1.722 0.546
Общая стоимость $0.328 $0.044
???? ????? $0.500 / 1M $1.200 / 1M
???? ?????? $3.000 / 1M $4.000 / 1M
Выходные токены 1,985 1,739
Токены рассуждений 102,122 0
Время ответа (среднее) 11.43s 3.06s
Время ответа (макс.) 74.66s 6.51s
Время ответа (суммарно) 217.10s 58.10s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.88s 330 3,216
GLM 5V Turbo 4.8 10.0 25.0% 0 3.13s 281 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 74.66s 432 48,771
GLM 5V Turbo 10.0 10.0 100.0% 0 5.30s 336 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 22.42s 351 10,485
GLM 5V Turbo 3.0 10.0 0.0% 0 6.51s 276 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.43s 279 4,893
GLM 5V Turbo 10.0 10.0 100.0% 0 3.81s 204 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 15.27s 12 21,684
GLM 5V Turbo 5.3 10.0 33.3% 0 2.09s 24 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.19s 72 1,905
GLM 5V Turbo 4.6 10.0 0.0% 0 2.22s 114 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.04s 72 2,709
GLM 5V Turbo 6.5 10.0 50.0% 0 1.97s 60 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.48s 192 4,647
GLM 5V Turbo 5.3 10.0 33.3% 0 2.22s 207 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 12.60s 234 1,487
GLM 5V Turbo 10.0 10.0 100.0% 0 4.86s 222 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.50s 11 2,325
GLM 5V Turbo 3.0 10.0 0.0% 0 2.23s 15 0

Быстрое сравнение

Сменить пару сравнения