Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

xAI: Grok 4.20 vs Z.ai: GLM 5 Turbo

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика Grok 4.20 Grok 4.20 none Релиз: 2026-03-31 GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15
Оценка 5.4 5.3
Ранг #120 #125
Надежность Н/Д 10.0
Стабильность 9.5 9.3
Тестов верно
Доля успешных попыток 35.2% 33.3%
Нестабильные тесты 1 2
Всего запусков 54 60
Стоимость за результат 1.574 0.602
Общая стоимость $0.095 $0.037
???? ????? $1.250 / 1M $1.200 / 1M
???? ?????? $2.500 / 1M $4.000 / 1M
Выходные токены 1,967 1,809
Токены рассуждений 0 0
Время ответа (среднее) 1.11s 2.83s
Время ответа (макс.) 6.04s 8.21s
Время ответа (суммарно) 20.02s 56.58s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
GLM 5 Turbo 3.0 10.0 0.0% 0 2.84s 382 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Grok 4.20 3.4 9.3 0.0% 0 1.22s 312 0
GLM 5 Turbo 4.4 6.7 16.7% 1 2.58s 523 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
GLM 5 Turbo 3.0 10.0 0.0% 0 4.89s 144 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
GLM 5 Turbo 10.0 10.0 100.0% 0 2.47s 204 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
GLM 5 Turbo 5.3 10.0 33.3% 0 1.97s 25 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
GLM 5 Turbo 4.2 9.9 0.0% 0 2.18s 48 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Grok 4.20 6.3 10.0 50.0% 0 455ms 60 0
GLM 5 Turbo 6.5 10.0 50.0% 0 2.13s 65 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Grok 4.20 5.3 7.2 44.4% 1 487ms 242 0
GLM 5 Turbo 5.5 7.4 44.4% 1 2.43s 180 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0
GLM 5 Turbo 10.0 10.0 100.0% 0 8.21s 222 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Grok 4.20 - - - - - - - -
GLM 5 Turbo 3.0 10.0 0.0% 0 2.37s 16 0

Быстрое сравнение

Сменить пару сравнения