AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#81

GLM 5.1

Z.ai Релиз: 2026-04-07 Проверено: 2026-04-22 12:55 z-ai/glm-5.1::none
(medium) (none)

Стабильность

8.2

Надежность

Н/Д

Общее число выходных токенов

3,720

???? ?????

$1.050 / 1M

???? ??????

$3.500 / 1M

Тестов верно

Ошибочных тестов: 13

Доля успешных попыток: 37.0%

Нестабильные тесты

4

Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).

Время ответа (среднее)

4.33s

Время ответа (макс.): 32.57s

Время ответа (суммарно): 78.02s

История запусков

Проверено Оценка Надежность Тестов верно Общая стоимость Сравнить
2026-05-21 23:41 Набор изменён 5.6 10.0 $0.057 Сравнить
2026-05-08 13:04 Набор изменён 5.7 10.0 $0.053 Сравнить
2026-05-08 13:04 Набор изменён 5.7 10.0 $0.053 Сравнить
2026-04-22 12:55 Первый зафиксированный запуск 5.6 Н/Д $0.053 Текущий запуск

Сравнение запусков

ЗапускОценкаСтабильностьНадежностьТестов верноНестабильные тестыОбщее число выходных токеновОбщая стоимостьВремя ответа (среднее)
2026-04-22 12:55 · Первый зафиксированный запуск5.68.2Н/Д5/1843,720$0.0534.33s
2026-05-08 13:04 · Набор изменён5.78.010.06/1953,731$0.0534.23s
Разница-0.1+0.2-1-1-11-$0.001+105ms

Эти два запуска использовали разные наборы бенчмарков, поэтому различия отражают и изменения модели, и изменения набора.

Графики

Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Быстрое сравнение

Разбивка по категориям

Категория Оценка Стабильность Тестов верно
Анти-ИИ уловки 4.0 6.3
Программирование 5.1 9.1
Комбинированный 2.8 2.1
Парсинг и извлечение данных 10.0 10.0
Предметно-ориентированное 2.9 7.2
Общий интеллект 5.0 10.0
Следование инструкциям 8.3 10.0
Решение головоломок 5.7 10.0
Вызов инструментов 10.0 10.0

Сравниваемые модели