OpenAI: GPT-5 Nano vs Qwen: Qwen3.5-Flash

A pontuação média está praticamente empatada em 6.1 vs 6.1. Qwen3.5-Flash tem menor custo de benchmark com $0.073 vs $0.114. Qwen3.5-Flash é mais rápido com 25.28s vs 54.87s, com taxas de acerto de 56.1% vs 39.4%.

Modelo recomendadoQwen3.5-FlashTem a melhor pontuação aqui (6.1) e custa cerca de 1.6x menos que GPT-5 Nano (medium).

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-07-17

Métrica	GPT-5 Nano GPT-5 Nano medium Lançamento: 2025-08-07	Qwen3.5-Flash Qwen3.5-Flash none Lançamento: 2026-02-24

Métrica	GPT-5 Nano GPT-5 Nano medium Lançamento: 2025-08-07	Qwen3.5-Flash Qwen3.5-Flash none Lançamento: 2026-02-24
Pontuação	6.1	6.1
Posição	#121	#118
Confiabilidade	10.0	10.0
Consistência	7.0	9.3
Testes corretos
Taxa de acerto por tentativa	56.1%	39.4%
Testes instáveis	8	2
Execuções totais	66	66
Custo por resultado	1.267	0.933
Custo total	$0.114	$0.073
Preço de entrada	$0.050 / 1M	$0.065 / 1M
Preço de saída	$0.400 / 1M	$0.260 / 1M
Total de tokens de entrada	94,935	282,347
Tokens de saída	12,042	209,201
Tokens de raciocínio	261,056	0
Tempo de resposta (médio)	54.87s	25.28s
Tempo de resposta (máx.)	227.89s	480.96s
Tempo de resposta (total)	822.99s	556.24s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#121 GPT-5 Nano

medium

Custo: $0.006
Tempo: 108.5s
Tokens: 13,209 tok

#118 Qwen3.5-Flash

none

Custo: $0.003
Tempo: 47.4s
Tokens: 7,799 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Categoria:

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5 Nano	6.5	7.9	58.3%	1		25.50s	606	1,221	21,184
Qwen3.5-Flash	3.5	8.3	8.3%	1		1.32s	696	690	0

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5 Nano	7.0	7.7	55.6%	1		41.62s	7,305	740	41,152
Qwen3.5-Flash	5.5	10.0	33.3%	0		850ms	7,913	519	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5 Nano	6.4	5.8	66.7%	1		146.93s	71,846	7,156	86,976
Qwen3.5-Flash	2.9	5.8	16.7%	1		243.59s	254,787	206,719	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5 Nano	3.7	1.7	50.0%	2		21.42s	7,140	453	10,560
Qwen3.5-Flash	10.0	10.0	100.0%	0		1.57s	7,794	243	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5 Nano	5.2	4.4	55.6%	2		204.02s	619	237	64,448
Qwen3.5-Flash	7.7	10.0	66.7%	0		905ms	789	15	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5 Nano	4.1	10.0	0.0%	0		17.51s	477	202	4,608
Qwen3.5-Flash	10.0	10.0	100.0%	0		803ms	522	100	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5 Nano	9.8	10.0	100.0%	0		15.64s	660	312	4,736
Qwen3.5-Flash	6.3	10.0	50.0%	0		8.81s	711	63	0

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5 Nano	5.3	7.2	44.4%	1		20.63s	642	929	14,272
Qwen3.5-Flash	3.1	10.0	0.0%	0		10.89s	714	579	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5 Nano	10.0	10.0	100.0%	0		33.30s	5,445	558	6,976
Qwen3.5-Flash	10.0	10.0	100.0%	0		3.67s	8,211	264	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5 Nano	3.0	10.0	0.0%	0		20.13s	195	234	6,144
Qwen3.5-Flash	3.0	10.0	0.0%	0		588ms	210	9	0

Comparação rápida

Trocar par de comparação

Nemotron 3 UltranoneDisponível grátisvsGPT-5 Nanomedium GPT-5 NanomediumvsQwen3.5-35B-A3Bnone GPT-5 NanomediumvsQwen3.5 Plus 2026-04-20none gpt-oss-120bmediumvsQwen3.5-Flashnone GPT-5 NanomediumvsQwen3.6 Flashnone Gemini 3.1 Flash LitenonevsGPT-5 Nanomedium Gemini 3.1 Flash LiteminimalvsQwen3.5-Flashnone Qwen3.5-FlashnonevsStep 3.5 Flashmedium Gemini 3.1 Flash LiteminimalvsGPT-5 Nanomedium Gemini 2.5 FlashnonevsGPT-5 Nanomedium GPT-5.6 LunalowvsQwen3.5-Flashnone Seed-2.0-LitenonevsGPT-5 Nanomedium