AI BENCHY
Advertise here

#113

GLM 5.1

Z.ai Релиз: 2026-04-07 Проверено: 2026-05-21 23:41 z-ai/glm-5.1::none
(medium) (none)

Стабильность

8.1

Общее число выходных токенов

3,749

???? ?????

$0.980 / 1M

???? ??????

$3.080 / 1M

Тестов верно

Ошибочных тестов: 14

Доля успешных попыток: 40.0%

Нестабильные тесты

5

Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).

Время ответа (среднее)

4.16s

Время ответа (макс.): 32.57s

Время ответа (суммарно): 83.23s

История запусков

Проверено Оценка Надежность Тестов верно Общая стоимость Сравнить
2026-05-21 23:41 Набор изменён 5.6 10.0 $0.057 Текущий запуск
2026-05-08 13:04 Набор изменён 5.7 10.0 $0.053 Сравнить
2026-05-08 13:04 Набор изменён 5.7 10.0 $0.053 Сравнить
2026-04-22 12:55 Первый зафиксированный запуск 5.6 Н/Д $0.053 Сравнить

Этот запуск использовал другой набор бенчмарков. Учитывайте изменения набора при чтении исторической динамики.

Сравнение запусков

ЗапускОценкаСтабильностьНадежностьТестов верноНестабильные тестыОбщее число выходных токеновОбщая стоимостьВремя ответа (среднее)
2026-05-21 23:41 · Текущий запуск5.68.110.06/2053,749$0.0574.16s
2026-04-22 12:55 · Первый зафиксированный запуск5.68.2Н/Д5/1843,720$0.0534.33s
Разница0.0-0.1+1+1+29+$0.005-173ms

Эти два запуска использовали разные наборы бенчмарков, поэтому различия отражают и изменения модели, и изменения набора.

Графики

Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Быстрое сравнение

Разбивка по категориям

Категория Оценка Стабильность Тестов верно
Анти-ИИ уловки 4.0 6.3
Программирование 4.3 9.5
Комбинированный 2.8 2.1
Парсинг и извлечение данных 10.0 10.0
Предметно-ориентированное 2.9 7.2
Общий интеллект 5.0 10.0
Следование инструкциям 9.8 10.0
Решение головоломок 6.1 7.8
Вызов инструментов 10.0 10.0
Эрудиция 3.0 10.0

Сравниваемые модели