AI BENCHY Compare

Qwen: Qwen3.5-9B vs Z.ai: GLM 5 Turbo

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика	Qwen3.5-9B Qwen3.5-9B none Релиз: 2026-03-02	GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15

Метрика	Qwen3.5-9B Qwen3.5-9B none Релиз: 2026-03-02	GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15
Оценка	4.6	5.3
Ранг	#142	#125
Надежность	10.0	10.0
Стабильность	9.7	9.3
Тестов верно
Доля успешных попыток	21.7%	33.3%
Нестабильные тесты	1	2
Всего запусков	60	60
Стоимость за результат	0.120	0.602
Общая стоимость	$0.005	$0.037
???? ?????	$0.040 / 1M	$1.200 / 1M
???? ??????	$0.150 / 1M	$4.000 / 1M
Выходные токены	3,984	1,809
Токены рассуждений	0	0
Время ответа (среднее)	1.69s	2.83s
Время ответа (макс.)	5.91s	8.21s
Время ответа (суммарно)	33.84s	56.58s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-9B	3.1	9.9	0.0%	0		1.71s	582	0
GLM 5 Turbo	3.0	10.0	0.0%	0		2.84s	382	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-9B	4.4	6.7	16.7%	1		5.39s	1,033	0
GLM 5 Turbo	4.4	6.7	16.7%	1		2.58s	523	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-9B	3.0	10.0	0.0%	0		5.91s	1,255	0
GLM 5 Turbo	3.0	10.0	0.0%	0		4.89s	144	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-9B	10.0	10.0	100.0%	0		847ms	249	0
GLM 5 Turbo	10.0	10.0	100.0%	0		2.47s	204	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-9B	3.0	10.0	0.0%	0		464ms	24	0
GLM 5 Turbo	5.3	10.0	33.3%	0		1.97s	25	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-9B	4.4	9.9	0.0%	0		552ms	99	0
GLM 5 Turbo	4.2	9.9	0.0%	0		2.18s	48	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-9B	6.5	10.0	50.0%	0		514ms	75	0
GLM 5 Turbo	6.5	10.0	50.0%	0		2.13s	65	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-9B	3.1	10.0	0.0%	0		683ms	388	0
GLM 5 Turbo	5.5	7.4	44.4%	1		2.43s	180	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-9B	10.0	10.0	100.0%	0		1.27s	273	0
GLM 5 Turbo	10.0	10.0	100.0%	0		8.21s	222	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-9B	3.0	10.0	0.0%	0		2.32s	6	0
GLM 5 Turbo	3.0	10.0	0.0%	0		2.37s	16	0

Быстрое сравнение

Сменить пару сравнения

Elephant AlphamediumvsGLM 5 Turbonone Mistral Small 4mediumvsGLM 5 Turbonone MiniMax M2.5mediumБесплатно доступноvsGLM 5 Turbonone Qwen3.5-9BnonevsGLM 4.7 Flashmedium MiniMax M2.7mediumvsGLM 5 Turbonone gpt-oss-120bmediumБесплатно доступноvsGLM 5 Turbonone MiniMax M2.7mediumvsQwen3.5-9Bnone CobuddymediumБесплатно доступноvsGLM 5 Turbonone Owl AlphamediumvsGLM 5 Turbonone Qwen3 Coder NextmediumvsGLM 5 Turbonone Nemotron 3 SupermediumБесплатно доступноvsGLM 5 Turbonone Elephant AlphamediumvsQwen3.5-9Bnone