AI BENCHY Compare

Hunter Alpha vs xAI: Grok 4.1 Fast

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-12

Métrica	Hunter Alpha Hunter Alpha none Lançamento: Data de lançamento desconhecida	Grok 4.1 Fast Grok 4.1 Fast medium Lançamento: 2025-11-19

Métrica	Hunter Alpha Hunter Alpha none Lançamento: Data de lançamento desconhecida	Grok 4.1 Fast Grok 4.1 Fast medium Lançamento: 2025-11-19
Posição	#50	#32
Pontuação média	4.6	6.2
Consistência	8.0	7.9
Custo por resultado	0.000	0.563
Custo total	$0.000	$0.051
Testes corretos
Taxa de acerto por tentativa	52.1%	66.7%
Testes instáveis	4	4
Execuções totais	48	48
Tokens de saída	2,272	1,183
Tokens de raciocínio	0	83,875
Tempo de resposta (médio)	4.64s	26.35s
Tempo de resposta (máx.)	15.17s	121.79s
Tempo de resposta (total)	74.24s	237.11s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação média vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação média vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Hunter Alpha	1.3	7.4	22.2%	1		3.85s	773	0
Grok 4.1 Fast	10.0	10.0	100.0%	0		5.65s	102	4,021

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Hunter Alpha	10.0	10.0	0.0%	0		15.17s	379	0
Grok 4.1 Fast	10.0	10.0	100.0%	0		37.64s	261	12,272

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Hunter Alpha	9.9	10.0	100.0%	0		8.49s	249	0
Grok 4.1 Fast	9.9	10.0	100.0%	0		6.63s	180	5,409

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Hunter Alpha	4.0	10.0	33.3%	0		2.33s	27	0
Grok 4.1 Fast	4.0	4.4	66.7%	2		121.79s	11	37,657

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Hunter Alpha	5.0	3.1	66.7%	1		2.71s	91	0
Grok 4.1 Fast	3.0	9.9	0.0%	0		16.25s	127	3,456

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Hunter Alpha	5.0	10.0	50.0%	0		2.82s	69	0
Grok 4.1 Fast	5.5	10.0	50.0%	0		5.30s	55	3,489

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Hunter Alpha	4.0	4.4	66.7%	2		3.06s	349	0
Grok 4.1 Fast	4.0	7.2	44.4%	1		8.08s	187	6,086

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Hunter Alpha	10.0	10.0	100.0%	0		6.02s	335	0
Grok 4.1 Fast	10.0	1.6	33.3%	1		27.71s	260	11,485

Comparação rápida

Trocar par de comparação

Qwen3.5 Plus 2026-02-15nonevsGrok 4.1 Fastmedium MiniMax M2.5mediumvsHunter Alphanone Grok 4.1 FastmediumvsGLM 5none Hunter AlphanonevsGrok 4.20 Multi-Agent Betamedium gpt-oss-120bmediumDisponível grátisvsHunter Alphanone Claude Sonnet 4.6nonevsGrok 4.1 Fastmedium DeepSeek V3.2nonevsGrok 4.1 Fastmedium Mercury 2mediumvsHunter Alphanone Gemini 3.1 Flash Lite PreviewnonevsGrok 4.1 Fastmedium Hunter AlphanonevsQwen3.5-35B-A3Bmedium GPT-5 NanomediumvsHunter Alphanone Qwen3.5-FlashnonevsGrok 4.1 Fastmedium