AI BENCHY Compare

Qwen: Qwen3 Coder Next vs Z.ai: GLM 4.7 Flash

Сводка

Сравнение benchmark Qwen3 Coder Next vs GLM 4.7 Flash: Qwen3 Coder Next лидирует по среднему баллу: 5.1 vs 4.3. Qwen3 Coder Next имеет более низкую стоимость benchmark: $0.009 vs $0.054. Qwen3 Coder Next быстрее: 8.62s vs 35.10s, с долей успешных попыток 27.0% vs 33.3%.

Рекомендуемая модель: Qwen3 Coder Next - Здесь у него лучший балл (5.1), при этом он примерно в 6.6 раза дешевле, чем GLM 4.7 Flash.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-02

Метрика	Qwen3 Coder Next Qwen3 Coder Next none Релиз: 2026-02-03	GLM 4.7 Flash GLM 4.7 Flash medium Релиз: 2026-01-19

Метрика	Qwen3 Coder Next Qwen3 Coder Next none Релиз: 2026-02-03	GLM 4.7 Flash GLM 4.7 Flash medium Релиз: 2026-01-19
Оценка	5.1	4.3
Ранг	#135	#162
Надежность	10.0	6.7
Стабильность	9.7	6.8
Тестов верно
Доля успешных попыток	27.0%	33.3%
Нестабильные тесты	1	8
Всего запусков	63	63
Стоимость за результат	0.165	1.337
Общая стоимость	$0.009	$0.054
Цена входа	$0.110 / 1M	$0.060 / 1M
Цена выхода	$0.800 / 1M	$0.400 / 1M
Общее число входных токенов	47,507	37,206
Выходные токены	3,584	43,754
Токены рассуждений	0	89,079
Время ответа (среднее)	8.62s	35.10s
Время ответа (макс.)	45.14s	174.55s
Время ответа (суммарно)	129.37s	456.24s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#135 Qwen3 Coder Next

none

Неверный SVG

Стоимость: $0.058
Время: 246.3s
Токены: 64,126 tok

#162 GLM 4.7 Flash

medium

Неверный SVG

Стоимость: $0.000
Время: 186.2s
Токены: 12,112 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	3.6	10.0	0.0%	0		3.31s	645	1,321	0
GLM 4.7 Flash	4.7	5.9	41.7%	2		14.95s	555	1,122	6,110

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	4.6	7.9	22.2%	1		2.22s	7,442	621	0
GLM 4.7 Flash	3.2	7.4	11.1%	1		55.33s	3,106	4,981	22,387

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	3.0	10.0	0.0%	0		45.14s	20,469	317	0
GLM 4.7 Flash	2.8	2.1	33.3%	1		65.57s	17,185	2,585	20,648

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	6.5	10.0	50.0%	0		1.32s	7,758	246	0
GLM 4.7 Flash	6.3	10.0	50.0%	0		1.51s	7,107	584	2,755

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	5.3	10.0	33.3%	0		962ms	753	26	0
GLM 4.7 Flash	3.5	4.4	33.3%	2		174.55s	643	33,000	25,394

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	498	152	0
GLM 4.7 Flash	3.6	9.7	0.0%	0		18.14s	318	18	2,138

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	6.3	10.0	50.0%	0		7.78s	684	63	0
GLM 4.7 Flash	6.2	5.8	66.7%	1		2.97s	636	388	2,181

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	3.0	10.0	0.0%	0		24.34s	678	571	0
GLM 4.7 Flash	2.9	7.2	11.1%	1		12.93s	521	781	5,255

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	8,364	255	0
GLM 4.7 Flash	10.0	10.0	100.0%	0		15.95s	6,949	224	1,014

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3 Coder Next	3.0	10.0	0.0%	0		601ms	216	12	0
GLM 4.7 Flash	3.0	10.0	0.0%	0		11.13s	186	71	1,197

Быстрое сравнение

Сменить пару сравнения

Mistral Small 4mediumvsQwen3 Coder Nextnone MiniMax M2.7mediumvsQwen3 Coder Nextnone Grok 4.20nonevsGLM 4.7 Flashmedium CobuddymediumvsQwen3 Coder Nextnone Granite 4.1 8BnonevsGLM 4.7 Flashmedium gpt-oss-120bnoneБесплатно доступноvsGLM 4.7 Flashmedium Mercury 2nonevsGLM 4.7 Flashmedium MiniMax M2.5mediumvsQwen3 Coder Nextnone Ling-2.6-1TnonevsGLM 4.7 Flashmedium GPT-5.4 NanononevsGLM 4.7 Flashmedium Ring-2.6-1TnonevsGLM 4.7 Flashmedium Ling-2.6-flashnonevsGLM 4.7 Flashmedium