Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Z.ai: GLM 5.2 vs Z.ai: GLM 5

Сводка

Сравнение benchmark GLM 5.2 vs GLM 5: GLM 5.2 лидирует по среднему баллу: 8.7 vs 8.6. GLM 5 имеет более низкую стоимость benchmark: $0.228 vs $0.324. GLM 5.2 быстрее: 23.28s vs 33.54s, с долей успешных попыток 84.1% vs 82.5%.

Рекомендуемая модель: GLM 5 - Он дает лучший общий компромисс: конкурентный балл (8.6), ниже стоимость, чем у GLM 5.2, и сбалансированное время ответа.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-17

Метрика GLM 5.2 GLM 5.2 medium Релиз: 2026-06-17 GLM 5 GLM 5 medium Релиз: 2026-02-12
Оценка 8.7 8.6
Ранг #14 #15
Надежность 9.5 10.0
Стабильность 8.4 8.5
Тестов верно
Доля успешных попыток 84.1% 82.5%
Нестабильные тесты 4 4
Всего запусков 63 63
Стоимость за результат 2.159 1.668
Общая стоимость $0.324 $0.228
Цена входа $1.400 / 1M $0.600 / 1M
Цена выхода $4.400 / 1M $1.920 / 1M
Общее число входных токенов 37,199 35,224
Выходные токены 12,261 21,570
Токены рассуждений 49,500 102,996
Время ответа (среднее) 23.28s 33.54s
Время ответа (макс.) 101.36s 99.85s
Время ответа (суммарно) 488.94s 435.99s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#14 GLM 5.2

medium
Cost
$0.041
Time
195.8s
Tokens
9,287 tok

#15 GLM 5

medium
Cost
$0.005
Time
20.7s
Tokens
2,068 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GLM 5.2 10.0 10.0 100.0% 0 5.89s 639 497 2,634
GLM 5 10.0 10.0 100.0% 0 23.66s 555 480 7,056
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GLM 5.2 8.2 7.2 88.9% 1 40.96s 7,317 1,475 17,123
GLM 5 10.0 10.0 100.0% 0 74.30s 7,254 2,997 52,930
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GLM 5.2 10.0 10.0 100.0% 0 51.96s 12,696 458 4,531
GLM 5 10.0 10.0 100.0% 0 28.96s 12,804 662 3,242
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GLM 5.2 10.0 10.0 100.0% 0 13.44s 7,149 348 2,345
GLM 5 7.1 5.6 83.3% 1 8.90s 5,508 567 3,734
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GLM 5.2 4.1 4.4 44.5% 2 45.47s 551 8,188 11,606
GLM 5 3.5 4.4 33.3% 2 0ms 260 13,176 14,137
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GLM 5.2 10.0 10.0 100.0% 0 17.39s 498 54 1,842
GLM 5 6.1 3.1 66.7% 1 14.69s 477 2,020 2,248
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GLM 5.2 9.9 10.0 100.0% 0 7.90s 678 94 1,518
GLM 5 10.0 10.0 100.0% 0 7.25s 636 1,001 2,129
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GLM 5.2 8.2 7.2 88.9% 1 13.13s 672 536 4,822
GLM 5 10.0 10.0 100.0% 0 11.33s 609 33 4,076
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GLM 5.2 10.0 10.0 100.0% 0 20.41s 6,861 230 550
GLM 5 10.0 10.0 100.0% 0 15.93s 6,935 233 994
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GLM 5.2 3.0 10.0 0.0% 0 34.25s 138 381 2,529
GLM 5 3.0 10.0 0.0% 0 67.37s 186 401 12,450

Быстрое сравнение

Сменить пару сравнения