AI BENCHY Compare

Qwen: Qwen3.5-122B-A10B vs Z.ai: GLM 5

Сводка

Сравнение benchmark Qwen3.5-122B-A10B vs GLM 5: GLM 5 лидирует по среднему баллу: 6.0 vs 5.3. Qwen3.5-122B-A10B имеет более низкую стоимость benchmark: $0.020 vs $0.027. Qwen3.5-122B-A10B быстрее: 3.41s vs 4.03s, с долей успешных попыток 31.8% vs 44.4%.

Рекомендуемая модель: Qwen3.5-122B-A10B - Он дает лучший общий компромисс: конкурентный балл (5.3), ниже стоимость, чем у GLM 5, и сбалансированное время ответа.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-18

Метрика	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Релиз: 2026-02-24	GLM 5 GLM 5 none Релиз: 2026-02-12

Метрика	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Релиз: 2026-02-24	GLM 5 GLM 5 none Релиз: 2026-02-12
Оценка	5.3	6.0
Ранг	#125	#101
Надежность	10.0	10.0
Стабильность	9.6	9.7
Тестов верно
Доля успешных попыток	31.8%	44.4%
Нестабильные тесты	1	1
Всего запусков	63	63
Стоимость за результат	0.393	0.263
Общая стоимость	$0.020	$0.027
Цена входа	$0.260 / 1M	$0.600 / 1M
Цена выхода	$2.080 / 1M	$1.920 / 1M
Общее число входных токенов	47,735	37,135
Выходные токены	3,383	1,989
Токены рассуждений	0	0
Время ответа (среднее)	3.41s	4.03s
Время ответа (макс.)	46.00s	11.07s
Время ответа (суммарно)	71.59s	56.37s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#125 Qwen3.5-122B-A10B

none

Стоимость: $0.016
Время: 44.5s
Токены: 6,431 tok

#101 GLM 5

none

Стоимость: $0.007
Время: 32.1s
Токены: 2,023 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	4.8	10.0	25.0%	0		1.59s	696	312	0
GLM 5	4.8	10.0	25.0%	0		2.37s	510	275	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	3.7	7.0	22.2%	1		2.77s	7,913	693	0
GLM 5	4.0	7.8	11.1%	1		5.12s	7,256	428	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		46.00s	20,175	1,137	0
GLM 5	3.0	10.0	0.0%	0		4.98s	12,812	406	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		1.01s	7,794	243	0
GLM 5	10.0	10.0	100.0%	0		5.78s	7,107	203	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	5.3	10.0	33.3%	0		465ms	789	15	0
GLM 5	3.0	10.0	0.0%	0		2.24s	643	19	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	5.0	10.0	0.0%	0		1.12s	522	66	0
GLM 5	10.0	10.0	100.0%	0		3.27s	477	103	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	6.3	10.0	50.0%	0		513ms	711	69	0
GLM 5	10.0	10.0	100.0%	0		1.48s	636	61	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	3.8	10.0	0.0%	0		1.00s	714	575	0
GLM 5	7.7	10.0	66.7%	0		1.91s	609	261	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		2.04s	8,211	264	0
GLM 5	10.0	10.0	100.0%	0		11.07s	6,899	220	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		295ms	210	9	0
GLM 5	3.0	10.0	0.0%	0		3.62s	186	13	0

Быстрое сравнение

Сменить пару сравнения

MiniMax M2.7mediumvsQwen3.5-122B-A10Bnone North Mini CodemediumБесплатно доступноvsGLM 5none Gemini 3.1 Flash LiteminimalvsGLM 5none Mistral Small 4mediumvsQwen3.5-122B-A10Bnone Qwen3.5-35B-A3BmediumvsGLM 5none Gemma 4 31BmediumБесплатно доступноvsGLM 5none Nemotron 3 SupermediumБесплатно доступноvsGLM 5none CobuddymediumvsQwen3.5-122B-A10Bnone Gemini 3.1 Flash LitelowvsGLM 5none Gemini 3.1 Flash Lite PreviewlowvsGLM 5none North Mini CodemediumБесплатно доступноvsQwen3.5-122B-A10Bnone MiniMax M2.5mediumvsQwen3.5-122B-A10Bnone