AI BENCHY Compare

OpenAI: GPT-5.4 vs Hunter Alpha

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-12

Métrica	GPT-5.4 GPT-5.4 none Lançamento: 2026-03-05	Hunter Alpha Hunter Alpha none Lançamento: Data de lançamento desconhecida

Métrica	GPT-5.4 GPT-5.4 none Lançamento: 2026-03-05	Hunter Alpha Hunter Alpha none Lançamento: Data de lançamento desconhecida
Posição	#51	#50
Pontuação média	4.5	4.6
Consistência	8.9	8.0
Custo por resultado	1.562	0.000
Custo total	$0.094	$0.000
Testes corretos
Taxa de acerto por tentativa	41.7%	52.1%
Testes instáveis	2	4
Execuções totais	48	48
Tokens de saída	1,819	2,272
Tokens de raciocínio	0	0
Tempo de resposta (médio)	1.48s	4.64s
Tempo de resposta (máx.)	2.89s	15.17s
Tempo de resposta (total)	23.64s	74.24s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação média vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação média vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0
Hunter Alpha	1.3	7.4	22.2%	1		3.85s	773	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0
Hunter Alpha	10.0	10.0	0.0%	0		15.17s	379	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0
Hunter Alpha	9.9	10.0	100.0%	0		8.49s	249	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0
Hunter Alpha	4.0	10.0	33.3%	0		2.33s	27	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
GPT-5.4	3.0	9.9	0.0%	0		1.78s	184	0
Hunter Alpha	5.0	3.1	66.7%	1		2.71s	91	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0
Hunter Alpha	5.0	10.0	50.0%	0		2.82s	69	0

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0
Hunter Alpha	4.0	4.4	66.7%	2		3.06s	349	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0
Hunter Alpha	10.0	10.0	100.0%	0		6.02s	335	0

Comparação rápida

Trocar par de comparação

MiniMax M2.5mediumvsHunter Alphanone MiniMax M2.5mediumvsGPT-5.4none Hunter AlphanonevsGrok 4.20 Multi-Agent Betamedium GPT-5.4nonevsGrok 4.20 Multi-Agent Betamedium gpt-oss-120bmediumDisponível grátisvsHunter Alphanone Mercury 2mediumvsHunter Alphanone Mercury 2mediumvsGPT-5.4none Hunter AlphanonevsQwen3.5-35B-A3Bmedium GPT-5 NanomediumvsHunter Alphanone GPT-5.4nonevsQwen3 Coder Nextmedium GPT-5.4nonevsQwen3.5-35B-A3Bmedium Hunter AlphanonevsQwen3 Coder Nextmedium