AI BENCHY Compare

Qwen: Qwen3.6 Max Preview vs Z.ai: GLM 5 Turbo

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-30

Метрика	Qwen3.6 Max Preview Qwen3.6 Max Preview none Релиз: 2026-04-20	GLM 5 Turbo GLM 5 Turbo medium Релиз: 2026-03-15

Метрика	Qwen3.6 Max Preview Qwen3.6 Max Preview none Релиз: 2026-04-20	GLM 5 Turbo GLM 5 Turbo medium Релиз: 2026-03-15
Оценка	7.3	8.1
Ранг	#56	#23
Надежность	10.0	Н/Д
Стабильность	8.7	8.0
Тестов верно
Доля успешных попыток	66.7%	77.8%
Нестабильные тесты	3	5
Всего запусков	54	54
Стоимость за результат	0.827	1.511
Общая стоимость	$0.083	$0.182
???? ?????	$1.040 / 1M	$1.200 / 1M
???? ??????	$6.240 / 1M	$4.000 / 1M
Выходные токены	4,732	12,197
Токены рассуждений	0	38,933
Время ответа (среднее)	3.38s	17.67s
Время ответа (макс.)	20.51s	194.23s
Время ответа (суммарно)	60.83s	317.98s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Max Preview	5.2	7.9	41.7%	1		2.63s	513	0
GLM 5 Turbo	10.0	10.0	100.0%	0		4.82s	362	3,137

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Max Preview	5.0	2.0	66.7%	1		3.45s	426	0
GLM 5 Turbo	10.0	10.0	100.0%	0		12.26s	332	3,301

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Max Preview	3.0	10.0	0.0%	0		20.51s	2,842	0
GLM 5 Turbo	10.0	10.0	100.0%	0		13.88s	390	2,037

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		2.87s	243	0
GLM 5 Turbo	10.0	10.0	100.0%	0		6.19s	577	3,632

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Max Preview	7.7	10.0	66.7%	0		1.22s	18	0
GLM 5 Turbo	2.9	4.4	22.2%	2		71.07s	9,665	19,279

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Max Preview	4.3	10.0	0.0%	0		1.62s	76	0
GLM 5 Turbo	6.1	3.1	66.7%	1		10.05s	60	2,216

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Max Preview	8.4	6.9	83.3%	1		1.45s	69	0
GLM 5 Turbo	10.0	10.0	100.0%	0		5.38s	255	2,183

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		2.38s	323	0
GLM 5 Turbo	7.3	5.8	55.6%	2		5.44s	315	2,702

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		5.27s	222	0
GLM 5 Turbo	10.0	10.0	100.0%	0		9.84s	241	446

Быстрое сравнение

Сменить пару сравнения

HY3 PreviewlowБесплатно доступноvsGLM 5 Turbomedium Gemini 3 Flash PreviewnonevsGLM 5 Turbomedium Gemini 3.1 Flash Lite PreviewlowvsGLM 5 Turbomedium GPT-5.4 MinimediumvsQwen3.6 Max Previewnone Qwen3.6 Max PreviewnonevsMiMo-V2-Flashmedium GPT-5.2mediumvsQwen3.6 Max Previewnone Seed-2.0-MinimediumvsQwen3.6 Max Previewnone GPT-5.4 NanomediumvsQwen3.6 Max Previewnone GPT-5.2 ChatnonevsGLM 5 Turbomedium Gemini 3.1 Flash Lite PreviewnonevsGLM 5 Turbomedium Claude Opus 4.6mediumvsQwen3.6 Max Previewnone DeepSeek V4 FlashhighvsGLM 5 Turbomedium