OpenAI: GPT-5.5 vs Qwen: Qwen3.7 Plus

GPT-5.5 (low) лидирует по среднему баллу: 9.3 vs 7.9. Qwen3.7 Plus (medium) имеет более низкую стоимость benchmark: $0.267 vs $1.253. GPT-5.5 (low) быстрее: 10.13s vs 51.51s, с долей успешных попыток 86.4% vs 75.8%.

Рекомендуемая модельGPT-5.5 (low)Здесь у него лучший балл (9.3), и он отвечает примерно в 5.1 раза быстрее, чем Qwen3.7 Plus (medium).

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-18

Метрика	GPT-5.5 GPT-5.5 low Релиз: 2026-04-24	Qwen3.7 Plus Qwen3.7 Plus medium Релиз: 2026-06-03

Метрика	GPT-5.5 GPT-5.5 low Релиз: 2026-04-24	Qwen3.7 Plus Qwen3.7 Plus medium Релиз: 2026-06-03
Оценка	9.3	7.9
Ранг	#6	#36
Надежность	10.0	10.0
Стабильность	10.0	8.9
Тестов верно
Доля успешных попыток	86.4%	75.8%
Нестабильные тесты	0	3
Всего запусков	66	66
Стоимость за результат	6.594	2.072
Общая стоимость	$1.253	$0.267
Цена входа	$5.000 / 1M	$0.320 / 1M
Цена выхода	$30.000 / 1M	$1.280 / 1M
Общее число входных токенов	80,058	115,233
Выходные токены	5,378	6,162
Токены рассуждений	23,040	173,267
Время ответа (среднее)	10.13s	51.51s
Время ответа (макс.)	56.19s	315.30s
Время ответа (суммарно)	222.82s	1133.15s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#6 GPT-5.5

low

Стоимость: $0.068
Время: 37.0s
Токены: 2,339 tok

#36 Qwen3.7 Plus

medium

Стоимость: $0.018
Время: 193.2s
Токены: 10,821 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		4.41s	606	238	1,020
Qwen3.7 Plus	10.0	10.0	100.0%	0		8.58s	672	195	5,065

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		15.04s	7,302	423	6,402
Qwen3.7 Plus	6.1	6.6	55.6%	1		108.60s	6,472	414	43,576

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		13.73s	56,868	3,635	1,297
Qwen3.7 Plus	8.2	6.9	66.7%	1		190.27s	89,228	4,403	57,645

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		3.28s	7,140	228	157
Qwen3.7 Plus	10.0	10.0	100.0%	0		21.75s	7,782	270	6,713

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	5.3	10.0	33.3%	0		28.05s	723	69	11,609
Qwen3.7 Plus	3.6	7.2	22.2%	1		45.35s	771	57	27,073

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		5.17s	477	133	245
Qwen3.7 Plus	10.0	10.0	100.0%	0		25.48s	516	123	3,998

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	9.9	10.0	100.0%	0		3.74s	660	93	415
Qwen3.7 Plus	10.0	10.0	100.0%	0		16.13s	699	102	5,013

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		4.74s	642	279	954
Qwen3.7 Plus	10.0	10.0	100.0%	0		16.38s	696	280	7,312

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		4.96s	5,445	250	101
Qwen3.7 Plus	10.0	10.0	100.0%	0		15.02s	8,193	292	1,831

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.5	3.0	10.0	0.0%	0		10.06s	195	30	840
Qwen3.7 Plus	3.0	10.0	0.0%	0		91.07s	204	26	15,041

Быстрое сравнение

Сменить пару сравнения

GPT-5.6 TerrahighvsQwen3.7 Plusmedium Kimi K3maxvsQwen3.7 Plusmedium Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Claude Opus 4.8lowvsQwen3.7 Plusmedium Qwen3.7 PlusmediumvsGLM 5.2high GPT-5.2 ChatnonevsQwen3.7 Plusmedium GPT-5.6 LunahighvsQwen3.7 Plusmedium Qwen3.7 PlusmediumvsInklinghigh GPT-5.5lowvsQwen3.7 Maxmedium DeepSeek V4 FlashhighvsQwen3.7 Plusmedium Gemini 3.5 FlashmediumvsGPT-5.5low Muse Spark 1.1highvsQwen3.7 Plusmedium