GPT-5.3 Chat vs Qwen3.6 Max Preview (medium)

Qwen3.6 Max Preview (medium) лидирует по среднему баллу: 8.4 vs 7.5. GPT-5.3 Chat имеет более низкую стоимость benchmark: $0.571 vs $1.143. GPT-5.3 Chat быстрее: 6.88s vs 67.53s, с долей успешных попыток 68.2% vs 80.3%.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Ранг: #62
Общее число выходных токенов: 30,854
Время ответа (среднее): 6.88s
Общая стоимость: $0.571

Ранг: #25
Общее число выходных токенов: 169,940
Время ответа (среднее): 67.53s
Общая стоимость: $1.143

Рекомендуемая модель GPT-5.3 Chat

Он дает лучший общий компромисс: конкурентный балл (7.5), ниже стоимость, чем у Qwen3.6 Max Preview (medium), и сбалансированное время ответа.

Подробное сравнение

Метрика	GPT-5.3 Chat GPT-5.3 Chat none Релиз: 2026-03-03	Qwen3.6 Max Preview Qwen3.6 Max Preview medium Релиз: 2026-04-20

Метрика	GPT-5.3 Chat GPT-5.3 Chat none Релиз: 2026-03-03	Qwen3.6 Max Preview Qwen3.6 Max Preview medium Релиз: 2026-04-20
Оценка	7.5	8.4
Ранг	#62	#25
Надежность	10.0	9.9
Стабильность	8.2	8.9
Тестов верно
Доля успешных попыток	68.2%	80.3%
Нестабильные тесты	5	3
Всего запусков	66	66
Стоимость за результат	4.387	8.173
Общая стоимость	$0.571	$1.143
Цена входа	$1.750 / 1M	$1.040 / 1M
Цена выхода	$14.000 / 1M	$6.240 / 1M
Общее число входных токенов	78,990	79,240
Выходные токены	30,854	5,098
Токены рассуждений	0	164,842
Время ответа (среднее)	6.88s	67.53s
Время ответа (макс.)	18.33s	238.07s
Время ответа (суммарно)	151.31s	1485.64s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#62 GPT-5.3 Chat

none

Стоимость: $0.008
Время: 8.1s
Токены: 634 tok

#25 Qwen3.6 Max Preview

medium

Стоимость: $0.024
Время: 76.5s
Токены: 3,861 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.3 Chat	6.7	8.1	58.3%	1		3.86s	606	3,167	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		22.13s	672	228	10,075

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.3 Chat	5.6	4.7	55.6%	2		10.52s	7,302	6,632	0
Qwen3.6 Max Preview	8.8	7.8	88.9%	1		146.48s	7,895	427	52,957

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.3 Chat	10.0	10.0	100.0%	0		15.07s	55,800	6,851	0
Qwen3.6 Max Preview	7.3	5.8	83.3%	1		177.48s	51,812	3,215	35,050

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.21s	7,140	942	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		41.15s	7,782	270	10,106

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.3 Chat	3.5	4.4	33.3%	2		13.01s	723	8,264	0
Qwen3.6 Max Preview	2.9	7.2	11.1%	1		95.91s	771	60	30,371

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.3 Chat	4.6	10.0	0.0%	0		1.99s	477	319	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		32.24s	516	129	3,510

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.3 Chat	9.8	10.0	100.0%	0		3.51s	660	1,491	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		24.31s	699	103	5,848

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.99s	642	1,758	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		24.32s	696	329	7,693

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.3 Chat	10.0	10.0	100.0%	0		8.36s	5,445	861	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		18.32s	8,193	309	1,571

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.3 Chat	3.0	10.0	0.0%	0		4.38s	195	569	0
Qwen3.6 Max Preview	3.0	10.0	0.0%	0		60.56s	204	28	7,661

Быстрое сравнение

Сменить пару сравнения

Kimi K2.7 CodemediumvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsQwen3.5 Plus 2026-02-15medium Qwen3.6 Max PreviewmediumvsGrok 4.5low Nemotron 3 UltramediumБесплатно доступноvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsQwen3.5-27Bmedium GPT-5.3 ChatnonevsGrok Build 0.1medium LongCat 2.0mediumvsGPT-5.3 Chatnone MiniMax M3mediumvsGPT-5.3 Chatnone Gemini 3 Flash PreviewlowvsGPT-5.3 Chatnone KAT-Coder-Pro V2.5lowvsGPT-5.3 Chatnone DeepSeek V4 ProhighvsGPT-5.3 Chatnone DeepSeek V4 FlashhighvsGPT-5.3 Chatnone