Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.7 Max vs Z.ai: GLM 5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика Qwen3.7 Max Qwen3.7 Max medium Релиз: 2026-05-22 GLM 5 GLM 5 medium Релиз: 2026-02-12
Оценка 9.0 8.2
Ранг #5 #18
Надежность 10.0 10.0
Стабильность 9.6 8.4
Тестов верно
Доля успешных попыток 88.3% 81.7%
Нестабильные тесты 1 4
Всего запусков 60 60
Стоимость за результат 5.540 1.688
Общая стоимость $0.942 $0.237
???? ????? $2.500 / 1M $0.600 / 1M
???? ?????? $7.500 / 1M $1.920 / 1M
Выходные токены 2,109 23,219
Токены рассуждений 110,285 96,679
Время ответа (среднее) 13.83s 33.39s
Время ответа (макс.) 33.37s 99.85s
Время ответа (суммарно) 276.53s 400.62s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 10.0 10.0 100.0% 0 6.36s 222 8,742
GLM 5 10.0 10.0 100.0% 0 23.66s 480 7,056
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 10.0 10.0 100.0% 0 22.98s 403 22,134
GLM 5 10.0 10.0 100.0% 0 89.47s 2,985 45,706
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 10.0 10.0 100.0% 0 19.60s 366 8,405
GLM 5 10.0 10.0 100.0% 0 28.96s 662 3,242
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 10.0 10.0 100.0% 0 8.80s 270 6,254
GLM 5 7.1 5.6 83.3% 1 8.90s 567 3,734
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 5.9 7.2 55.6% 1 24.94s 61 31,793
GLM 5 3.5 4.4 33.3% 2 0ms 13,176 14,137
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 10.0 10.0 100.0% 0 11.70s 135 4,457
GLM 5 6.1 3.1 66.7% 1 14.69s 2,020 2,248
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 10.0 10.0 100.0% 0 7.46s 102 5,452
GLM 5 10.0 10.0 100.0% 0 7.25s 1,001 2,129
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 10.0 10.0 100.0% 0 8.84s 259 8,908
GLM 5 10.0 10.0 100.0% 0 15.64s 1,694 4,983
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 10.0 10.0 100.0% 0 6.63s 267 1,220
GLM 5 10.0 10.0 100.0% 0 15.93s 233 994
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.7 Max 3.0 10.0 0.0% 0 33.37s 24 12,920
GLM 5 3.0 10.0 0.0% 0 67.37s 401 12,450

Быстрое сравнение

Сменить пару сравнения