AI BENCHY Compare

Qwen: Qwen3.5-35B-A3B vs Z.ai: GLM 5

Сводка

Сравнение benchmark Qwen3.5-35B-A3B vs GLM 5: Qwen3.5-35B-A3B лидирует по среднему баллу: 6.3 vs 6.0. GLM 5 имеет более низкую стоимость benchmark: $0.027 vs $0.401. GLM 5 быстрее: 4.03s vs 72.57s, с долей успешных попыток 69.8% vs 44.4%.

Рекомендуемая модель: GLM 5 - Его балл близок к лучшему здесь (6.0 против 6.3), при этом он примерно в 15.3 раза дешевле, чем Qwen3.5-35B-A3B.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-12

Метрика	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Релиз: 2026-02-24	GLM 5 GLM 5 none Релиз: 2026-02-12

Метрика	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Релиз: 2026-02-24	GLM 5 GLM 5 none Релиз: 2026-02-12
Оценка	6.3	6.0
Ранг	#88	#106
Надежность	10.0	10.0
Стабильность	7.5	9.7
Тестов верно
Доля успешных попыток	69.8%	44.4%
Нестабильные тесты	6	1
Всего запусков	63	63
Стоимость за результат	5.162	0.263
Общая стоимость	$0.401	$0.027
Цена входа	$0.140 / 1M	$0.600 / 1M
Цена выхода	$1.000 / 1M	$1.920 / 1M
Общее число входных токенов	42,196	37,135
Выходные токены	40,630	1,989
Токены рассуждений	353,577	0
Время ответа (среднее)	72.57s	4.03s
Время ответа (макс.)	409.98s	11.07s
Время ответа (суммарно)	1524.04s	56.37s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#88 Qwen3.5-35B-A3B

medium

Cost: $0.009
Time: 71.4s
Tokens: 8,631 tok

#106 GLM 5

none

Cost: $0.007
Time: 32.1s
Tokens: 2,023 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.13s	672	798	42,652
GLM 5	4.8	10.0	25.0%	0		2.37s	510	275	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	5.9	9.3	33.3%	0		206.65s	4,106	23,844	111,462
GLM 5	4.0	7.8	11.1%	1		5.12s	7,256	428	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	4.7	1.6	66.7%	1		75.34s	20,992	775	12,485
GLM 5	3.0	10.0	0.0%	0		4.98s	12,812	406	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	7.3	5.9	83.3%	1		59.33s	6,061	235	19,493
GLM 5	10.0	10.0	100.0%	0		5.78s	7,107	203	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	4.1	4.4	44.5%	2		88.34s	500	41	46,368
GLM 5	3.0	10.0	0.0%	0		2.24s	643	19	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	2.8	1.6	33.3%	1		30.30s	172	20	3,753
GLM 5	10.0	10.0	100.0%	0		3.27s	477	103	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	699	97	17,361
GLM 5	10.0	10.0	100.0%	0		1.48s	636	61	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	8.2	7.2	88.9%	1		33.13s	597	3,592	26,585
GLM 5	7.7	10.0	66.7%	0		1.91s	609	261	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	8,193	309	1,365
GLM 5	10.0	10.0	100.0%	0		11.07s	6,899	220	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	3.0	10.0	0.0%	0		177.35s	204	10,919	72,053
GLM 5	3.0	10.0	0.0%	0		3.62s	186	13	0

Быстрое сравнение

Сменить пару сравнения