AI BENCHY Compare

Qwen: Qwen3.5-35B-A3B vs Z.ai: GLM 5.1

Сводка

Сравнение benchmark Qwen3.5-35B-A3B vs GLM 5.1: Qwen3.5-35B-A3B лидирует по среднему баллу: 6.3 vs 5.6. GLM 5.1 имеет более низкую стоимость benchmark: $0.058 vs $0.401. GLM 5.1 быстрее: 4.10s vs 72.57s, с долей успешных попыток 69.8% vs 41.3%.

Рекомендуемая модель: GLM 5.1 - Его балл близок к лучшему здесь (5.6 против 6.3), при этом он примерно в 6.9 раза дешевле, чем Qwen3.5-35B-A3B.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-18

Метрика	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Релиз: 2026-02-24	GLM 5.1 GLM 5.1 none Релиз: 2026-04-07

Метрика	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Релиз: 2026-02-24	GLM 5.1 GLM 5.1 none Релиз: 2026-04-07
Оценка	6.3	5.6
Ранг	#89	#116
Надежность	10.0	10.0
Стабильность	7.5	8.5
Тестов верно
Доля успешных попыток	69.8%	41.3%
Нестабильные тесты	6	4
Всего запусков	63	63
Стоимость за результат	5.162	0.843
Общая стоимость	$0.401	$0.058
Цена входа	$0.140 / 1M	$0.980 / 1M
Цена выхода	$1.000 / 1M	$3.080 / 1M
Общее число входных токенов	42,196	47,133
Выходные токены	40,630	3,754
Токены рассуждений	353,577	0
Время ответа (среднее)	72.57s	4.10s
Время ответа (макс.)	409.98s	32.57s
Время ответа (суммарно)	1524.04s	86.18s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#89 Qwen3.5-35B-A3B

medium

Cost: $0.009
Time: 71.4s
Tokens: 8,631 tok

#116 GLM 5.1

none

Invalid SVG

Cost: $0.000
Time: 300.0s
Tokens: 0 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.13s	672	798	42,652
GLM 5.1	4.0	6.3	25.0%	2		2.11s	555	305	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	5.9	9.3	33.3%	0		206.65s	4,106	23,844	111,462
GLM 5.1	3.9	9.7	0.0%	0		4.96s	7,256	525	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	4.7	1.6	66.7%	1		75.34s	20,992	775	12,485
GLM 5.1	2.8	2.1	33.3%	1		32.57s	22,831	2,129	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	7.3	5.9	83.3%	1		59.33s	6,061	235	19,493
GLM 5.1	10.0	10.0	100.0%	0		1.08s	7,107	204	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	4.1	4.4	44.5%	2		88.34s	500	41	46,368
GLM 5.1	2.9	7.2	11.1%	1		1.99s	687	24	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	2.8	1.6	33.3%	1		30.30s	172	20	3,753
GLM 5.1	5.0	10.0	0.0%	0		790ms	477	39	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	699	97	17,361
GLM 5.1	9.8	10.0	100.0%	0		1.98s	636	66	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	8.2	7.2	88.9%	1		33.13s	597	3,592	26,585
GLM 5.1	7.7	10.0	66.7%	0		1.45s	609	151	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	8,193	309	1,365
GLM 5.1	10.0	10.0	100.0%	0		10.68s	6,789	300	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	3.0	10.0	0.0%	0		177.35s	204	10,919	72,053
GLM 5.1	3.0	10.0	0.0%	0		2.34s	186	11	0

Быстрое сравнение

Сменить пару сравнения