AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs Z.ai: GLM 5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-14

Метрика	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none Релиз: 2026-02-15	GLM 5 GLM 5 medium Релиз: 2026-02-12

Метрика	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none Релиз: 2026-02-15	GLM 5 GLM 5 medium Релиз: 2026-02-12
Оценка	6.8	8.4
Ранг	#46	#11
Стабильность	9.3	8.2
Тестов верно
Доля успешных попыток	53.7%	85.2%
Нестабильные тесты	2	4
Всего запусков	54	54
Стоимость за результат	0.182	1.188
Общая стоимость	$0.017	$0.155
???? ?????	$0.260 / 1M	$0.720 / 1M
???? ??????	$1.560 / 1M	$2.300 / 1M
Выходные токены	2,461	20,163
Токены рассуждений	0	58,337
Время ответа (среднее)	2.60s	23.34s
Время ответа (макс.)	6.65s	79.09s
Время ответа (суммарно)	31.23s	233.40s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	4.8	10.0	25.0%	0		1.91s	517	0
GLM 5	10.0	10.0	100.0%	0		23.66s	480	7,056

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	6.3	3.7	33.3%	1		3.63s	443	0
GLM 5	10.0	10.0	100.0%	0		79.09s	330	19,814

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		6.65s	314	0
GLM 5	10.0	10.0	100.0%	0		28.96s	662	3,242

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		1.89s	243	0
GLM 5	7.1	5.6	83.3%	1		8.90s	567	3,734

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0		1.17s	17	0
GLM 5	3.5	4.4	33.3%	2		0ms	13,176	14,137

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	4.4	3.0	33.3%	1		2.26s	117	0
GLM 5	6.1	3.1	66.7%	1		14.69s	2,020	2,248

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		1.67s	72	0
GLM 5	10.0	10.0	100.0%	0		7.25s	1,001	2,129

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	7.7	10.0	66.7%	0		2.82s	516	0
GLM 5	10.0	10.0	100.0%	0		15.64s	1,694	4,983

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		3.33s	222	0
GLM 5	10.0	10.0	100.0%	0		15.93s	233	994

Быстрое сравнение

Сменить пару сравнения

Nemotron 3 SupermediumБесплатно доступноvsQwen3.5 Plus 2026-02-15none Qwen3.5 Plus 2026-02-15nonevsGrok 4.1 Fastmedium Qwen3.5 Plus 2026-02-15nonevsGrok 4.20medium Kimi K2.5mediumvsQwen3.5 Plus 2026-02-15none Gemini 3 Flash PreviewnonevsGLM 5medium GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none Gemini 3.1 Flash Lite PreviewlowvsGLM 5medium Mercury 2mediumvsQwen3.5 Plus 2026-02-15none Gemini 3 Flash PreviewlowvsGLM 5medium GPT-5.2 ChatnonevsGLM 5medium Gemini 3.1 Flash Lite PreviewnonevsGLM 5medium GPT-5.4 MinimediumvsQwen3.5 Plus 2026-02-15none