AI BENCHY Compare

Qwen: Qwen3.6 Flash vs Z.ai: GLM 5 Turbo

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-29

Метрика	Qwen3.6 Flash Qwen3.6 Flash medium Релиз: 2026-04-20	GLM 5 Turbo GLM 5 Turbo medium Релиз: 2026-03-15

Метрика	Qwen3.6 Flash Qwen3.6 Flash medium Релиз: 2026-04-20	GLM 5 Turbo GLM 5 Turbo medium Релиз: 2026-03-15
Оценка	8.1	8.1
Ранг	#24	#23
Надежность	10.0	Н/Д
Стабильность	8.2	8.0
Тестов верно
Доля успешных попыток	79.6%	77.8%
Нестабильные тесты	4	5
Всего запусков	54	54
Стоимость за результат	1.449	1.511
Общая стоимость	$0.174	$0.182
???? ?????	$0.250 / 1M	$1.200 / 1M
???? ??????	$1.500 / 1M	$4.000 / 1M
Выходные токены	2,804	12,197
Токены рассуждений	107,210	38,933
Время ответа (среднее)	9.90s	17.67s
Время ответа (макс.)	26.85s	194.23s
Время ответа (суммарно)	178.26s	317.98s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Flash	10.0	10.0	100.0%	0		6.10s	624	14,024
GLM 5 Turbo	10.0	10.0	100.0%	0		4.82s	362	3,137

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Flash	6.7	3.5	66.7%	1		25.84s	435	17,044
GLM 5 Turbo	10.0	10.0	100.0%	0		12.26s	332	3,301

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Flash	10.0	10.0	100.0%	0		20.28s	483	13,839
GLM 5 Turbo	10.0	10.0	100.0%	0		13.88s	390	2,037

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Flash	10.0	10.0	100.0%	0		9.65s	270	13,155
GLM 5 Turbo	10.0	10.0	100.0%	0		6.19s	577	3,632

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Flash	3.5	4.4	33.3%	2		14.65s	60	24,409
GLM 5 Turbo	2.9	4.4	22.2%	2		71.07s	9,665	19,279

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Flash	4.8	9.9	0.0%	0		9.88s	140	5,445
GLM 5 Turbo	6.1	3.1	66.7%	1		10.05s	60	2,216

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Flash	10.0	10.0	100.0%	0		6.05s	102	7,423
GLM 5 Turbo	10.0	10.0	100.0%	0		5.38s	255	2,183

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Flash	8.2	7.2	88.9%	1		6.17s	355	10,683
GLM 5 Turbo	7.3	5.8	55.6%	2		5.44s	315	2,702

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.6 Flash	10.0	10.0	100.0%	0		4.00s	335	1,188
GLM 5 Turbo	10.0	10.0	100.0%	0		9.84s	241	446

Быстрое сравнение

Сменить пару сравнения

Qwen3.6 FlashmediumvsHY3 PreviewlowБесплатно доступно HY3 PreviewlowБесплатно доступноvsGLM 5 Turbomedium Gemini 3 Flash PreviewnonevsQwen3.6 Flashmedium Gemini 3 Flash PreviewnonevsGLM 5 Turbomedium Gemini 3.1 Flash Lite PreviewlowvsQwen3.6 Flashmedium Gemini 3.1 Flash Lite PreviewlowvsGLM 5 Turbomedium GPT-5.2 ChatnonevsQwen3.6 Flashmedium GPT-5.2 ChatnonevsGLM 5 Turbomedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.6 Flashmedium Gemini 3.1 Flash Lite PreviewnonevsGLM 5 Turbomedium DeepSeek V4 FlashhighvsQwen3.6 Flashmedium DeepSeek V4 FlashhighvsGLM 5 Turbomedium