AI BENCHY Compare

OpenAI: GPT-5.4 Nano vs Z.ai: GLM 5

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-17

Métrica	GPT-5.4 Nano GPT-5.4 Nano medium Lançamento: 2026-03-17	GLM 5 GLM 5 none Lançamento: 2026-02-12

Métrica	GPT-5.4 Nano GPT-5.4 Nano medium Lançamento: 2026-03-17	GLM 5 GLM 5 none Lançamento: 2026-02-12
Posição	#28	#40
Pontuação	7.4	6.7
Consistência	9.0	10.0
Custo por resultado	0.769	0.201
Custo total	$0.077	$0.019
Testes corretos
Taxa de acerto por tentativa	66.7%	52.9%
Testes instáveis	2	0
Execuções totais	51	51
Tokens de saída	2,474	1,551
Tokens de raciocínio	54,516	0
Tempo de resposta (médio)	11.08s	3.77s
Tempo de resposta (máx.)	94.06s	11.07s
Tempo de resposta (total)	188.39s	37.66s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
GPT-5.4 Nano	8.3	10.0	75.0%	0		4.52s	683	2,254
GLM 5	4.8	10.0	25.0%	0		2.37s	275	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
GPT-5.4 Nano	9.8	10.0	100.0%	0		24.13s	349	5,719
GLM 5	3.0	10.0	0.0%	0		4.98s	406	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
GPT-5.4 Nano	10.0	10.0	100.0%	0		2.54s	234	516
GLM 5	10.0	10.0	100.0%	0		5.78s	203	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
GPT-5.4 Nano	5.9	7.2	55.6%	1		38.18s	60	43,325
GLM 5	3.0	10.0	0.0%	0		2.24s	19	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
GPT-5.4 Nano	4.5	10.0	0.0%	0		4.15s	179	443
GLM 5	10.0	10.0	100.0%	0		3.27s	103	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
GPT-5.4 Nano	9.8	10.0	100.0%	0		1.88s	95	521
GLM 5	10.0	10.0	100.0%	0		1.48s	61	0

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
GPT-5.4 Nano	4.0	7.1	22.2%	1		3.65s	640	1,356
GLM 5	7.7	10.0	66.7%	0		2.05s	264	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
GPT-5.4 Nano	10.0	10.0	100.0%	0		7.71s	234	382
GLM 5	10.0	10.0	100.0%	0		11.07s	220	0

Comparação rápida

Trocar par de comparação

GPT-5 MinimediumvsGLM 5none Claude Sonnet 4.6nonevsGPT-5.4 Nanomedium Nemotron 3 Super 120b A12bmediumDisponível grátisvsGLM 5none Grok 4.1 FastmediumvsGLM 5none Hunter AlphamediumvsGLM 5none GPT-5.4 MinimediumvsGLM 5none Gemini 3.1 Flash Lite PreviewnonevsGPT-5.4 Nanomedium Mercury 2mediumvsGLM 5none GPT-5 NanomediumvsGLM 5none Kimi K2.5mediumvsGLM 5none Grok 4.20 Multi-Agent BetamediumvsGLM 5none Qwen3.5-35B-A3BmediumvsGLM 5none