GPT-5.4 Nano (medium) vs Qwen3.7 Max

GPT-5.4 Nano (medium) лидирует по среднему баллу: 7.5 vs 7.4. GPT-5.4 Nano (medium) имеет более низкую стоимость benchmark: $0.138 vs $0.197. Qwen3.7 Max быстрее: 4.52s vs 13.24s, с долей успешных попыток 65.2% vs 68.2%.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-28

Ранг: #62
Общее число выходных токенов: 97,122
Время ответа (среднее): 13.24s
Общая стоимость: $0.138

Ранг: #68
Общее число выходных токенов: 12,446
Время ответа (среднее): 4.52s
Общая стоимость: $0.197

Рекомендуемая модель Qwen3.7 Max

Его балл близок к лучшему здесь (7.4 против 7.5), и он отвечает примерно в 2.9 раза быстрее, чем GPT-5.4 Nano (medium).

Подробное сравнение

Метрика	GPT-5.4 Nano GPT-5.4 Nano medium Релиз: 2026-03-17	Qwen3.7 Max Qwen3.7 Max none Релиз: 2026-05-22

Метрика	GPT-5.4 Nano GPT-5.4 Nano medium Релиз: 2026-03-17	Qwen3.7 Max Qwen3.7 Max none Релиз: 2026-05-22
Оценка	7.5	7.4
Ранг	#62	#68
Надежность	10.0	9.9
Стабильность	8.5	10.0
Тестов верно
Доля успешных попыток	65.2%	68.2%
Нестабильные тесты	4	0
Всего запусков	66	66
Стоимость за результат	1.150	1.582
Общая стоимость	$0.138	$0.197
Цена входа	$0.200 / 1M	$1.475 / 1M
Цена выхода	$1.250 / 1M	$4.425 / 1M
Общее число входных токенов	82,819	95,983
Выходные токены	7,100	12,446
Токены рассуждений	90,022	0
Время ответа (среднее)	13.24s	4.52s
Время ответа (макс.)	94.06s	72.30s
Время ответа (суммарно)	291.33s	99.52s

Генерация showcase моделей

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#62 GPT-5.4 Nano

medium

Стоимость: $0.007
Время: 24.6s
Токены: 4,943 tok

#68 Qwen3.7 Max

none

Стоимость: $0.046
Время: 195.0s
Токены: 12,171 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4 Nano	8.3	10.0	75.0%	0		4.52s	606	683	2,254
Qwen3.7 Max	6.5	10.0	50.0%	0		1.08s	696	242	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4 Nano	6.1	4.7	66.7%	2		19.12s	7,305	516	20,778
Qwen3.7 Max	5.5	10.0	33.3%	0		1.35s	7,911	582	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4 Nano	9.9	10.0	100.0%	0		32.24s	59,730	4,435	19,221
Qwen3.7 Max	6.5	10.0	50.0%	0		37.23s	68,425	10,623	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4 Nano	10.0	10.0	100.0%	0		2.54s	7,140	234	516
Qwen3.7 Max	10.0	10.0	100.0%	0		1.35s	7,794	243	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4 Nano	5.9	7.2	55.6%	1		38.18s	619	60	43,325
Qwen3.7 Max	7.7	10.0	66.7%	0		975ms	789	15	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4 Nano	4.5	10.0	0.0%	0		4.15s	477	179	443
Qwen3.7 Max	10.0	10.0	100.0%	0		1.04s	522	120	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4 Nano	9.8	10.0	100.0%	0		1.88s	660	95	521
Qwen3.7 Max	10.0	10.0	100.0%	0		943ms	711	72	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4 Nano	4.1	7.2	22.2%	1		3.79s	642	594	1,408
Qwen3.7 Max	10.0	10.0	100.0%	0		1.13s	714	314	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4 Nano	10.0	10.0	100.0%	0		7.71s	5,445	234	382
Qwen3.7 Max	10.0	10.0	100.0%	0		3.92s	8,211	222	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.4 Nano	3.0	10.0	0.0%	0		4.81s	195	70	1,174
Qwen3.7 Max	3.0	10.0	0.0%	0		856ms	210	13	0

Быстрое сравнение

Сменить пару сравнения

Claude Opus 5nonevsGPT-5.4 Nanomedium LongCat 2.0mediumvsQwen3.7 Maxnone GPT-5.4 MinimediumvsQwen3.7 Maxnone GPT-5.6 TerralowvsQwen3.7 Maxnone Gemini 3 Flash PreviewlowvsQwen3.7 Maxnone KAT-Coder-Pro V2.5lowvsQwen3.7 Maxnone Kimi K2.7 CodemediumvsQwen3.7 Maxnone Nemotron 3 UltramediumБесплатно доступноvsQwen3.7 Maxnone Gemini 3.1 Flash Lite PreviewmediumvsQwen3.7 Maxnone GPT-5.6 LunamediumvsQwen3.7 Maxnone DeepSeek V4 ProhighvsGPT-5.4 Nanomedium Gemini 3.1 Flash LitemediumvsQwen3.7 Maxnone