AI BENCHY Compare

Qwen: Qwen3 Coder Next vs Z.ai: GLM 5 Turbo

Сводка

Сравнение benchmark Qwen3 Coder Next vs GLM 5 Turbo: GLM 5 Turbo лидирует по среднему баллу: 5.3 vs 4.7. Qwen3 Coder Next имеет более низкую стоимость benchmark: $0.008 vs $0.047. GLM 5 Turbo быстрее: 2.82s vs 8.58s, с долей успешных попыток 28.6% vs 31.8%.

Рекомендуемая модель: Qwen3 Coder Next - Его балл близок к лучшему здесь (4.7 против 5.3), при этом он примерно в 5.9 раза дешевле, чем GLM 5 Turbo.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-12

Метрика	Qwen3 Coder Next Qwen3 Coder Next medium Релиз: 2026-02-03	GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15

Метрика	Qwen3 Coder Next Qwen3 Coder Next medium Релиз: 2026-02-03	GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15
Оценка	4.7	5.3
Ранг	#153	#128
Надежность	10.0	10.0
Стабильность	8.9	9.3
Тестов верно
Доля успешных попыток	28.6%	31.8%
Нестабильные тесты	3	2
Всего запусков	63	63
Стоимость за результат	0.201	0.655
Общая стоимость	$0.008	$0.047
Цена входа	$0.110 / 1M	$1.200 / 1M
Цена выхода	$0.800 / 1M	$4.000 / 1M
Общее число входных токенов	47,250	32,525
Выходные токены	3,319	1,815
Токены рассуждений	0	0
Время ответа (среднее)	8.58s	2.82s
Время ответа (макс.)	81.80s	8.21s
Время ответа (суммарно)	128.68s	59.29s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#153 Qwen3 Coder Next

medium

Invalid SVG

Cost: $0.000
Time: 300.0s
Tokens: 0 tok

#128 GLM 5 Turbo

none

Cost: $0.047
Time: 129.2s
Tokens: 11,775 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	3.5	8.1	16.7%	1		8.64s	645	1,252	0
GLM 5 Turbo	3.0	10.0	0.0%	0		2.84s	555	382	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	3.7	7.2	22.2%	1		924ms	7,185	336	0
GLM 5 Turbo	3.9	7.8	11.1%	1		2.41s	7,256	529	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	3.0	10.0	0.0%	0		4.28s	20,469	317	0
GLM 5 Turbo	3.0	10.0	0.0%	0		4.89s	8,133	144	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	6.5	10.0	50.0%	0		81.80s	7,758	246	0
GLM 5 Turbo	10.0	10.0	100.0%	0		2.47s	7,107	204	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	5.3	10.0	33.3%	0		638ms	753	25	0
GLM 5 Turbo	5.3	10.0	33.3%	0		1.97s	687	25	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	6.3	3.4	66.7%	1		1.39s	498	142	0
GLM 5 Turbo	4.2	9.9	0.0%	0		2.18s	477	48	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	6.3	10.0	50.0%	0		7.49s	684	63	0
GLM 5 Turbo	6.5	10.0	50.0%	0		2.13s	636	65	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	3.0	10.0	0.0%	0		1.25s	678	671	0
GLM 5 Turbo	5.5	7.4	44.4%	1		2.65s	609	180	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.64s	8,364	255	0
GLM 5 Turbo	10.0	10.0	100.0%	0		8.21s	6,879	222	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	3.0	10.0	0.0%	0		399ms	216	12	0
GLM 5 Turbo	3.0	10.0	0.0%	0		2.37s	186	16	0

Быстрое сравнение

Сменить пару сравнения