Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5-27B vs Z.ai: GLM 5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-02

Метрика Qwen3.5-27B Qwen3.5-27B medium Релиз: 2026-02-24 GLM 5 GLM 5 medium Релиз: 2026-02-12
Оценка 7.9 8.2
Ранг #27 #19
Надежность 10.0 10.0
Стабильность 8.9 8.4
Тестов верно
Доля успешных попыток 73.3% 81.7%
Нестабильные тесты 3 4
Всего запусков 60 60
Стоимость за результат 4.532 1.676
Общая стоимость $0.488 $0.228
Цена входа $0.195 / 1M $0.600 / 1M
Цена выхода $1.560 / 1M $2.080 / 1M
Общее число входных токенов 39,329 32,626
Выходные токены 2,569 21,558
Токены рассуждений 304,894 95,772
Время ответа (среднее) 60.09s 32.67s
Время ответа (макс.) 177.36s 99.85s
Время ответа (суммарно) 1201.89s 392.01s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-27B 8.7 7.9 91.7% 1 19.75s 672 569 31,505
GLM 5 10.0 10.0 100.0% 0 23.66s 555 480 7,056
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-27B 7.0 9.8 50.0% 0 123.86s 5,060 416 64,993
GLM 5 10.0 10.0 100.0% 0 89.47s 4,656 2,985 45,706
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-27B 10.0 10.0 100.0% 0 163.96s 14,946 483 9,991
GLM 5 10.0 10.0 100.0% 0 28.96s 12,804 662 3,242
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-27B 10.0 10.0 100.0% 0 30.26s 7,782 270 16,150
GLM 5 7.1 5.6 83.3% 1 8.90s 5,508 567 3,734
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-27B 5.3 10.0 33.3% 0 79.53s 553 43 52,368
GLM 5 3.5 4.4 33.3% 2 0ms 260 13,176 14,137
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-27B 6.1 3.1 66.7% 1 101.41s 524 70 23,147
GLM 5 6.1 3.1 66.7% 1 14.69s 477 2,020 2,248
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-27B 10.0 10.0 100.0% 0 19.66s 699 97 11,638
GLM 5 10.0 10.0 100.0% 0 7.25s 636 1,001 2,129
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-27B 8.2 7.7 77.8% 1 59.60s 696 242 70,096
GLM 5 10.0 10.0 100.0% 0 11.33s 609 33 4,076
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-27B 10.0 10.0 100.0% 0 7.45s 8,193 348 1,323
GLM 5 10.0 10.0 100.0% 0 15.93s 6,935 233 994
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-27B 3.0 10.0 0.0% 0 85.11s 204 31 23,683
GLM 5 3.0 10.0 0.0% 0 67.37s 186 401 12,450

Быстрое сравнение

Сменить пару сравнения