GPT-5.5 (low) vs Qwen3.6 Max Preview (medium)

GPT-5.5 (low) лидирует по среднему баллу: 9.3 vs 8.4. Qwen3.6 Max Preview (medium) имеет более низкую стоимость benchmark: $1.143 vs $1.253. GPT-5.5 (low) быстрее: 10.13s vs 67.53s, с долей успешных попыток 86.4% vs 80.3%.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Ранг: #9
Общее число выходных токенов: 28,418
Время ответа (среднее): 10.13s
Общая стоимость: $1.253

Ранг: #25
Общее число выходных токенов: 169,940
Время ответа (среднее): 67.53s
Общая стоимость: $1.143

Рекомендуемая модель GPT-5.5 (low)

Здесь у него лучший балл (9.3), и он отвечает примерно в 6.7 раза быстрее, чем Qwen3.6 Max Preview (medium).

Подробное сравнение

Метрика	GPT-5.5 GPT-5.5 low Релиз: 2026-04-24	Qwen3.6 Max Preview Qwen3.6 Max Preview medium Релиз: 2026-04-20

Метрика	GPT-5.5 GPT-5.5 low Релиз: 2026-04-24	Qwen3.6 Max Preview Qwen3.6 Max Preview medium Релиз: 2026-04-20
Оценка	9.3	8.4
Ранг	#9	#25
Надежность	10.0	9.9
Стабильность	10.0	8.9
Тестов верно
Доля успешных попыток	86.4%	80.3%
Нестабильные тесты	0	3
Всего запусков	66	66
Стоимость за результат	6.594	8.173
Общая стоимость	$1.253	$1.143
Цена входа	$5.000 / 1M	$1.040 / 1M
Цена выхода	$30.000 / 1M	$6.240 / 1M
Общее число входных токенов	80,058	79,240
Выходные токены	5,378	5,098
Токены рассуждений	23,040	164,842
Время ответа (среднее)	10.13s	67.53s
Время ответа (макс.)	56.19s	238.07s
Время ответа (суммарно)	222.82s	1485.64s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#9 GPT-5.5

low

Стоимость: $0.068
Время: 37.0s
Токены: 2,339 tok

#25 Qwen3.6 Max Preview

medium

Стоимость: $0.024
Время: 76.5s
Токены: 3,861 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		4.41s	606	238	1,020
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		22.13s	672	228	10,075

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		15.04s	7,302	423	6,402
Qwen3.6 Max Preview	8.8	7.8	88.9%	1		146.48s	7,895	427	52,957

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		13.73s	56,868	3,635	1,297
Qwen3.6 Max Preview	7.3	5.8	83.3%	1		177.48s	51,812	3,215	35,050

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		3.28s	7,140	228	157
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		41.15s	7,782	270	10,106

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	5.3	10.0	33.3%	0		28.05s	723	69	11,609
Qwen3.6 Max Preview	2.9	7.2	11.1%	1		95.91s	771	60	30,371

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		5.17s	477	133	245
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		32.24s	516	129	3,510

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	9.9	10.0	100.0%	0		3.74s	660	93	415
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		24.31s	699	103	5,848

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		4.74s	642	279	954
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		24.32s	696	329	7,693

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		4.96s	5,445	250	101
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		18.32s	8,193	309	1,571

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	3.0	10.0	0.0%	0		10.06s	195	30	840
Qwen3.6 Max Preview	3.0	10.0	0.0%	0		60.56s	204	28	7,661

Быстрое сравнение

Сменить пару сравнения

Qwen3.6 Max PreviewmediumvsGrok 4.5low Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Claude Opus 5highvsGPT-5.5low Claude Opus 5mediumvsGPT-5.5low Claude Opus 5lowvsQwen3.6 Max Previewmedium Muse Spark 1.1lowvsQwen3.6 Max Previewmedium GPT-5.5lowvsQwen3.7 Maxmedium Gemini 3.5 FlashmediumvsGPT-5.5low Gemini 3.5 FlashhighvsGPT-5.5low Gemini 3 Flash PreviewmediumvsGPT-5.5low Gemini 3.6 FlashhighvsGPT-5.5low Muse Spark 1.1highvsQwen3.6 Max Previewmedium