AI BENCHY Compare

OpenAI: GPT-5 Nano vs Qwen: Qwen3.5-9B

Сводка

Сравнение benchmark GPT-5 Nano vs Qwen3.5-9B: GPT-5 Nano лидирует по среднему баллу: 6.3 vs 4.6. Qwen3.5-9B имеет более низкую стоимость benchmark: $0.006 vs $0.081. Qwen3.5-9B быстрее: 1.89s vs 42.51s, с долей успешных попыток 57.1% vs 20.6%.

Рекомендуемая модель: Qwen3.5-9B - Он дает лучший общий компромисс: конкурентный балл (4.6), ниже стоимость, чем у GPT-5 Nano, и сбалансированное время ответа.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-10

Метрика	GPT-5 Nano GPT-5 Nano medium Релиз: 2025-08-07	Qwen3.5-9B Qwen3.5-9B none Релиз: 2026-03-02

Метрика	GPT-5 Nano GPT-5 Nano medium Релиз: 2025-08-07	Qwen3.5-9B Qwen3.5-9B none Релиз: 2026-03-02
Оценка	6.3	4.6
Ранг	#95	#155
Надежность	10.0	10.0
Стабильность	7.3	9.7
Тестов верно
Доля успешных попыток	57.1%	20.6%
Нестабильные тесты	7	1
Всего запусков	63	63
Стоимость за результат	0.897	0.123
Общая стоимость	$0.081	$0.006
Цена входа	$0.050 / 1M	$0.100 / 1M
Цена выхода	$0.400 / 1M	$0.150 / 1M
Общее число входных токенов	34,108	48,041
Выходные токены	5,464	3,952
Токены рассуждений	192,064	0
Время ответа (среднее)	42.51s	1.89s
Время ответа (макс.)	204.02s	6.03s
Время ответа (суммарно)	595.09s	39.68s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#95 GPT-5 Nano

medium

Cost: $0.006
Time: 108.5s
Tokens: 13,209 tok

#155 Qwen3.5-9B

none

Invalid SVG

Cost: $0.000
Time: 300.0s
Tokens: 0 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5 Nano	6.5	7.9	58.3%	1		25.50s	606	1,221	21,184
Qwen3.5-9B	3.1	9.9	0.0%	0		1.71s	696	582	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5 Nano	7.0	7.7	55.6%	1		41.62s	7,305	740	41,152
Qwen3.5-9B	3.9	7.8	11.1%	1		5.60s	7,913	1,042	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5 Nano	10.0	10.0	100.0%	0		65.96s	11,019	578	17,984
Qwen3.5-9B	3.0	10.0	0.0%	0		5.91s	20,397	1,255	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5 Nano	3.7	1.7	50.0%	2		21.42s	7,140	453	10,560
Qwen3.5-9B	10.0	10.0	100.0%	0		847ms	7,788	249	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5 Nano	5.2	4.4	55.6%	2		204.02s	619	237	64,448
Qwen3.5-9B	3.0	10.0	0.0%	0		464ms	789	24	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5 Nano	4.1	10.0	0.0%	0		17.51s	477	202	4,608
Qwen3.5-9B	4.4	9.9	0.0%	0		552ms	522	99	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5 Nano	9.8	10.0	100.0%	0		15.64s	660	312	4,736
Qwen3.5-9B	6.5	10.0	50.0%	0		514ms	711	75	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5 Nano	5.3	7.2	44.4%	1		20.63s	642	929	14,272
Qwen3.5-9B	3.2	10.0	0.0%	0		621ms	714	347	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5 Nano	10.0	10.0	100.0%	0		33.30s	5,445	558	6,976
Qwen3.5-9B	10.0	10.0	100.0%	0		1.27s	8,301	273	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5 Nano	3.0	10.0	0.0%	0		20.13s	195	234	6,144
Qwen3.5-9B	3.0	10.0	0.0%	0		2.32s	210	6	0

Быстрое сравнение

Сменить пару сравнения

GPT-5 NanomediumvsQwen3.5 Plus 2026-02-15none Ring-2.6-1TnonevsGPT-5 Nanomedium Gemini 2.5 FlashnonevsGPT-5 Nanomedium Gemini 3.1 Flash LitenonevsGPT-5 Nanomedium GPT-5 NanomediumvsQwen3.7 Plusnone Gemini 3.1 Flash LiteminimalvsGPT-5 Nanomedium GPT-5 NanomediumvsGLM 5none Qwen3.5-9BnonevsGLM 4.7 Flashmedium Gemma 4 31BnoneБесплатно доступноvsGPT-5 Nanomedium Gemma 4 26B A4BnoneБесплатно доступноvsGPT-5 Nanomedium DeepSeek V4 ProhighvsGPT-5 Nanomedium Nemotron 3 Ultra 550b A55bnoneБесплатно доступноvsGPT-5 Nanomedium