Navegação
AI BENCHY
Your ad here

AI BENCHY Compare

Hunter Alpha vs xAI: Grok 4.1 Fast

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-12

Métrica Hunter Alpha Hunter Alpha medium Lançamento: Data de lançamento desconhecida Grok 4.1 Fast Grok 4.1 Fast medium Lançamento: 2025-11-19
Posição #35 #32
Pontuação média 5.9 6.2
Consistência 7.6 7.9
Custo por resultado 0.000 0.563
Custo total $0.000 $0.051
Testes corretos
Taxa de acerto por tentativa 68.8% 66.7%
Testes instáveis 5 4
Execuções totais 48 48
Tokens de saída 4,686 1,183
Tokens de raciocínio 17,821 83,875
Tempo de resposta (médio) 10.71s 26.35s
Tempo de resposta (máx.) 30.53s 121.79s
Tempo de resposta (total) 171.41s 237.11s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação média vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação média vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Hunter Alpha 7.0 7.2 88.9% 1 4.93s 441 1,003
Grok 4.1 Fast 10.0 10.0 100.0% 0 5.65s 102 4,021
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Hunter Alpha 10.0 1.6 66.7% 1 30.53s 792 3,456
Grok 4.1 Fast 10.0 10.0 100.0% 0 37.64s 261 12,272
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Hunter Alpha 9.9 10.0 100.0% 0 23.16s 1,488 8,017
Grok 4.1 Fast 9.9 10.0 100.0% 0 6.63s 180 5,409
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Hunter Alpha 10.0 10.0 0.0% 0 10.52s 892 2,406
Grok 4.1 Fast 4.0 4.4 66.7% 2 121.79s 11 37,657
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Hunter Alpha 8.0 3.7 66.7% 1 6.44s 116 260
Grok 4.1 Fast 3.0 9.9 0.0% 0 16.25s 127 3,456
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Hunter Alpha 9.5 10.0 100.0% 0 4.18s 208 465
Grok 4.1 Fast 5.5 10.0 50.0% 0 5.30s 55 3,489
Puzzle Solving Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Hunter Alpha 4.3 4.7 66.7% 2 5.36s 441 1,310
Grok 4.1 Fast 4.0 7.2 44.4% 1 8.08s 187 6,086
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Hunter Alpha 10.0 10.0 100.0% 0 17.33s 308 904
Grok 4.1 Fast 10.0 1.6 33.3% 1 27.71s 260 11,485

Comparação rápida

Trocar par de comparação