GPT-5.2 Chat vs Qwen3.6 Max Preview (medium)

Qwen3.6 Max Preview (medium) лидирует по среднему баллу: 8.4 vs 8.0. GPT-5.2 Chat имеет более низкую стоимость benchmark: $0.604 vs $1.143. GPT-5.2 Chat быстрее: 7.65s vs 67.53s, с долей успешных попыток 74.2% vs 80.3%.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Ранг: #37
Общее число выходных токенов: 30,424
Время ответа (среднее): 7.65s
Общая стоимость: $0.604

Ранг: #25
Общее число выходных токенов: 169,940
Время ответа (среднее): 67.53s
Общая стоимость: $1.143

Рекомендуемая модель GPT-5.2 Chat

Его балл близок к лучшему здесь (8.0 против 8.4), при этом он примерно в 1.9 раза дешевле, чем Qwen3.6 Max Preview (medium).

Подробное сравнение

Метрика	GPT-5.2 Chat GPT-5.2 Chat none Релиз: 2025-12-11	Qwen3.6 Max Preview Qwen3.6 Max Preview medium Релиз: 2026-04-20

Метрика	GPT-5.2 Chat GPT-5.2 Chat none Релиз: 2025-12-11	Qwen3.6 Max Preview Qwen3.6 Max Preview medium Релиз: 2026-04-20
Оценка	8.0	8.4
Ранг	#37	#25
Надежность	10.0	9.9
Стабильность	8.6	8.9
Тестов верно
Доля успешных попыток	74.2%	80.3%
Нестабильные тесты	4	3
Всего запусков	66	66
Стоимость за результат	4.308	8.173
Общая стоимость	$0.604	$1.143
Цена входа	$1.750 / 1M	$1.040 / 1M
Цена выхода	$14.000 / 1M	$6.240 / 1M
Общее число входных токенов	101,248	79,240
Выходные токены	30,424	5,098
Токены рассуждений	0	164,842
Время ответа (среднее)	7.65s	67.53s
Время ответа (макс.)	38.52s	238.07s
Время ответа (суммарно)	168.39s	1485.64s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#37 GPT-5.2 Chat

none

Стоимость: $0.010
Время: 15.3s
Токены: 797 tok

#25 Qwen3.6 Max Preview

medium

Стоимость: $0.024
Время: 76.5s
Токены: 3,861 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	8.7	7.9	91.7%	1		3.40s	606	1,807	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		22.13s	672	228	10,075

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	8.8	7.8	88.9%	1		9.82s	7,305	6,731	0
Qwen3.6 Max Preview	8.8	7.8	88.9%	1		146.48s	7,895	427	52,957

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	7.3	5.8	83.3%	1		13.91s	78,055	7,923	0
Qwen3.6 Max Preview	7.3	5.8	83.3%	1		177.48s	51,812	3,215	35,050

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	10.0	10.0	100.0%	0		3.05s	7,140	980	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		41.15s	7,782	270	10,106

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	5.3	10.0	33.3%	0		17.78s	723	7,810	0
Qwen3.6 Max Preview	2.9	7.2	11.1%	1		95.91s	771	60	30,371

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	4.4	3.0	33.3%	1		3.20s	477	335	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		32.24s	516	129	3,510

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	9.8	10.0	100.0%	0		5.51s	660	1,441	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		24.31s	699	103	5,848

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	7.7	10.0	66.7%	0		4.10s	642	1,603	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		24.32s	696	329	7,693

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	10.0	10.0	100.0%	0		4.68s	5,445	555	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		18.32s	8,193	309	1,571

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	3.0	10.0	0.0%	0		6.89s	195	1,239	0
Qwen3.6 Max Preview	3.0	10.0	0.0%	0		60.56s	204	28	7,661

Быстрое сравнение

Сменить пару сравнения

GPT-5.2 ChatnonevsStep 3.7 Flashmedium GPT-5.2 ChatnonevsInklinghigh Gemini 3.5 Flash-LitehighvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsGLM 5.2high Muse Spark 1.1highvsGPT-5.2 Chatnone Qwen3.6 Max PreviewmediumvsGrok 4.5low GPT-5.2 ChatnonevsInklingmedium Kimi K3maxvsGPT-5.2 Chatnone Seed-2.0-LitemediumvsGPT-5.2 Chatnone Claude Opus 5lowvsQwen3.6 Max Previewmedium GPT-5.2 ChatnonevsQwen3.7 Plusmedium Muse Spark 1.1lowvsQwen3.6 Max Previewmedium