Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5-9B vs Z.ai: GLM 5 Turbo

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика Qwen3.5-9B Qwen3.5-9B none Релиз: 2026-03-02 GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15
Оценка 4.6 5.3
Ранг #142 #125
Надежность 10.0 10.0
Стабильность 9.7 9.3
Тестов верно
Доля успешных попыток 21.7% 33.3%
Нестабильные тесты 1 2
Всего запусков 60 60
Стоимость за результат 0.120 0.602
Общая стоимость $0.005 $0.037
???? ????? $0.040 / 1M $1.200 / 1M
???? ?????? $0.150 / 1M $4.000 / 1M
Выходные токены 3,984 1,809
Токены рассуждений 0 0
Время ответа (среднее) 1.69s 2.83s
Время ответа (макс.) 5.91s 8.21s
Время ответа (суммарно) 33.84s 56.58s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-9B 3.1 9.9 0.0% 0 1.71s 582 0
GLM 5 Turbo 3.0 10.0 0.0% 0 2.84s 382 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-9B 4.4 6.7 16.7% 1 5.39s 1,033 0
GLM 5 Turbo 4.4 6.7 16.7% 1 2.58s 523 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-9B 3.0 10.0 0.0% 0 5.91s 1,255 0
GLM 5 Turbo 3.0 10.0 0.0% 0 4.89s 144 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-9B 10.0 10.0 100.0% 0 847ms 249 0
GLM 5 Turbo 10.0 10.0 100.0% 0 2.47s 204 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-9B 3.0 10.0 0.0% 0 464ms 24 0
GLM 5 Turbo 5.3 10.0 33.3% 0 1.97s 25 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-9B 4.4 9.9 0.0% 0 552ms 99 0
GLM 5 Turbo 4.2 9.9 0.0% 0 2.18s 48 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-9B 6.5 10.0 50.0% 0 514ms 75 0
GLM 5 Turbo 6.5 10.0 50.0% 0 2.13s 65 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-9B 3.1 10.0 0.0% 0 683ms 388 0
GLM 5 Turbo 5.5 7.4 44.4% 1 2.43s 180 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-9B 10.0 10.0 100.0% 0 1.27s 273 0
GLM 5 Turbo 10.0 10.0 100.0% 0 8.21s 222 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-9B 3.0 10.0 0.0% 0 2.32s 6 0
GLM 5 Turbo 3.0 10.0 0.0% 0 2.37s 16 0

Быстрое сравнение

Сменить пару сравнения