Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs xAI: Grok 4.1 Fast

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-17

Métrica GPT-5.4 Mini GPT-5.4 Mini none Lançamento: 2026-03-17 Grok 4.1 Fast Grok 4.1 Fast medium Lançamento: 2025-11-19
Posição #66 #36
Pontuação 4.8 6.9
Consistência 8.6 7.5
Custo por resultado 0.737 0.568
Custo total $0.030 $0.052
Testes corretos
Taxa de acerto por tentativa 31.4% 66.7%
Testes instáveis 3 5
Execuções totais 51 51
Tokens de saída 2,085 1,189
Tokens de raciocínio 0 84,595
Tempo de resposta (médio) 1.17s 23.91s
Tempo de resposta (máx.) 2.52s 121.79s
Tempo de resposta (total) 19.82s 239.09s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
Grok 4.1 Fast 8.7 7.9 91.7% 1 3.81s 108 4,741
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
Grok 4.1 Fast 10.0 10.0 100.0% 0 37.64s 261 12,272
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
Grok 4.1 Fast 10.0 10.0 100.0% 0 6.63s 180 5,409
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
Grok 4.1 Fast 5.8 4.4 66.7% 2 121.79s 11 37,657
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
Grok 4.1 Fast 4.2 9.9 0.0% 0 16.25s 127 3,456
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
Grok 4.1 Fast 6.6 10.0 50.0% 0 5.30s 55 3,489
Puzzle Solving Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
Grok 4.1 Fast 5.3 7.2 44.4% 1 8.08s 187 6,086
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0
Grok 4.1 Fast 2.8 1.6 33.3% 1 27.71s 260 11,485

Comparação rápida

Trocar par de comparação