Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Z.ai: GLM 5.1 vs Z.ai: GLM 5V Turbo

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика GLM 5.1 GLM 5.1 none Релиз: 2026-04-07 GLM 5V Turbo GLM 5V Turbo none Релиз: 2026-04-01
Оценка 5.6 5.9
Ранг #113 #98
Надежность 10.0 10.0
Стабильность 8.1 10.0
Тестов верно
Доля успешных попыток 40.0% 40.0%
Нестабильные тесты 5 0
Всего запусков 60 60
Стоимость за результат 0.941 0.606
Общая стоимость $0.057 $0.049
???? ????? $0.980 / 1M $1.200 / 1M
???? ?????? $3.080 / 1M $4.000 / 1M
Выходные токены 3,749 1,757
Токены рассуждений 0 0
Время ответа (среднее) 4.16s 3.02s
Время ответа (макс.) 32.57s 6.51s
Время ответа (суммарно) 83.23s 60.34s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GLM 5.1 4.0 6.3 25.0% 2 2.11s 305 0
GLM 5V Turbo 4.8 10.0 25.0% 0 3.13s 281 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GLM 5.1 4.3 9.5 0.0% 0 6.33s 519 0
GLM 5V Turbo 6.8 10.0 50.0% 0 3.77s 354 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GLM 5.1 2.8 2.1 33.3% 1 32.57s 2,129 0
GLM 5V Turbo 3.0 10.0 0.0% 0 6.51s 276 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GLM 5.1 10.0 10.0 100.0% 0 1.08s 204 0
GLM 5V Turbo 10.0 10.0 100.0% 0 3.81s 204 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GLM 5.1 2.9 7.2 11.1% 1 1.99s 24 0
GLM 5V Turbo 5.3 10.0 33.3% 0 2.09s 24 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GLM 5.1 5.0 10.0 0.0% 0 790ms 39 0
GLM 5V Turbo 4.6 10.0 0.0% 0 2.22s 114 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GLM 5.1 9.8 10.0 100.0% 0 1.58s 66 0
GLM 5V Turbo 6.5 10.0 50.0% 0 1.97s 60 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GLM 5.1 6.1 7.8 44.4% 1 1.48s 152 0
GLM 5V Turbo 5.3 10.0 33.3% 0 2.22s 207 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GLM 5.1 10.0 10.0 100.0% 0 10.68s 300 0
GLM 5V Turbo 10.0 10.0 100.0% 0 4.86s 222 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GLM 5.1 3.0 10.0 0.0% 0 2.34s 11 0
GLM 5V Turbo 3.0 10.0 0.0% 0 2.23s 15 0

Быстрое сравнение

Сменить пару сравнения