AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs Z.ai: GLM 5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-14

Метрика	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Релиз: 2026-02-15	GLM 5 GLM 5 none Релиз: 2026-02-12

Метрика	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Релиз: 2026-02-15	GLM 5 GLM 5 none Релиз: 2026-02-12
Оценка	8.5	6.6
Ранг	#6	#50
Стабильность	9.1	9.6
Тестов верно
Доля успешных попыток	83.3%	51.9%
Нестабильные тесты	2	1
Всего запусков	54	54
Стоимость за результат	1.566	0.217
Общая стоимость	$0.220	$0.020
???? ?????	$0.260 / 1M	$0.720 / 1M
???? ??????	$1.560 / 1M	$2.300 / 1M
Выходные токены	2,121	1,959
Токены рассуждений	111,889	0
Время ответа (среднее)	46.56s	4.23s
Время ответа (макс.)	120.91s	11.07s
Время ответа (суммарно)	512.20s	46.51s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	8.2	7.9	83.3%	1		45.78s	205	21,236
GLM 5	4.8	10.0	25.0%	0		2.37s	275	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		120.91s	367	19,367
GLM 5	5.6	3.5	33.3%	1		8.84s	408	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		46.85s	421	7,906
GLM 5	3.0	10.0	0.0%	0		4.98s	406	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		46.91s	270	14,916
GLM 5	10.0	10.0	100.0%	0		5.78s	203	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0		17.50s	35	16,680
GLM 5	3.0	10.0	0.0%	0		2.24s	19	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	4.7	1.6	66.7%	1		79.86s	73	8,675
GLM 5	10.0	10.0	100.0%	0		3.27s	103	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		31.93s	101	7,704
GLM 5	10.0	10.0	100.0%	0		1.48s	61	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		34.57s	340	14,496
GLM 5	7.7	10.0	66.7%	0		2.05s	264	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		7.54s	309	909
GLM 5	10.0	10.0	100.0%	0		11.07s	220	0

Быстрое сравнение

Сменить пару сравнения

Grok 4.1 FastmediumvsGLM 5none Nemotron 3 SupermediumБесплатно доступноvsGLM 5none Mercury 2mediumvsGLM 5none Gemini 3 Flash PreviewlowvsQwen3.5 Plus 2026-02-15medium Grok 4.20mediumvsGLM 5none Kimi K2.5mediumvsGLM 5none GPT-5 MinimediumvsGLM 5none Gemini 3 Flash PreviewnonevsQwen3.5 Plus 2026-02-15medium GPT-5 NanomediumvsGLM 5none Gemini 3.1 Flash Lite PreviewlowvsQwen3.5 Plus 2026-02-15medium GPT-5.2 ChatnonevsQwen3.5 Plus 2026-02-15medium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5 Plus 2026-02-15medium