Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Inception: Mercury 2 vs Z.ai: GLM 5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-03

Метрика Mercury 2 Mercury 2 medium Релиз: 2026-02-24 GLM 5 GLM 5 none Релиз: 2026-02-12
Оценка 6.5 6.3
Ранг #89 #96
Надежность 10.0 10.0
Стабильность 8.8 9.7
Тестов верно
Доля успешных попыток 51.7% 46.7%
Нестабильные тесты 3 1
Всего запусков 60 60
Стоимость за результат 0.611 0.246
Общая стоимость $0.055 $0.025
Цена входа $0.250 / 1M $0.600 / 1M
Цена выхода $0.750 / 1M $1.920 / 1M
Общее число входных токенов 32,570 34,537
Выходные токены 4,022 1,985
Токены рассуждений 58,405 0
Время ответа (среднее) 2.27s 3.95s
Время ответа (макс.) 14.63s 11.07s
Время ответа (суммарно) 43.20s 51.38s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 6.9 9.9 50.0% 0 1.12s 554 2,546 2,609
GLM 5 4.8 10.0 25.0% 0 2.37s 510 275 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 7.2 6.5 66.7% 1 2.29s 4,519 270 8,514
GLM 5 4.6 6.8 16.7% 1 5.18s 4,658 424 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 10.0 10.0 100.0% 0 3.28s 12,909 268 4,887
GLM 5 3.0 10.0 0.0% 0 4.98s 12,812 406 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 7.3 5.9 83.3% 1 1.11s 6,234 183 1,656
GLM 5 10.0 10.0 100.0% 0 5.78s 7,107 203 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 2.9 7.2 11.1% 1 6.48s 695 41 30,754
GLM 5 3.0 10.0 0.0% 0 2.24s 643 19 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 4.8 10.0 0.0% 0 821ms 456 137 542
GLM 5 10.0 10.0 100.0% 0 3.27s 477 103 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 10.0 10.0 100.0% 0 1.07s 340 14 958
GLM 5 10.0 10.0 100.0% 0 1.48s 636 61 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 5.4 10.0 33.3% 0 949ms 601 361 2,781
GLM 5 7.7 10.0 66.7% 0 1.91s 609 261 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 10.0 10.0 100.0% 0 1.89s 6,080 180 1,956
GLM 5 10.0 10.0 100.0% 0 11.07s 6,899 220 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 3.0 10.0 0.0% 0 2.58s 182 22 3,748
GLM 5 3.0 10.0 0.0% 0 3.62s 186 13 0

Быстрое сравнение

Сменить пару сравнения