AI BENCHY Compare

HY3 Preview vs xAI: Grok 4.3

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-01

Métrica	HY3 Preview HY3 Preview high Lançamento: 2026-04-22 Disponível grátis	Grok 4.3 Grok 4.3 medium Lançamento: 2026-05-01

Métrica	HY3 Preview HY3 Preview high Lançamento: 2026-04-22 Disponível grátis	Grok 4.3 Grok 4.3 medium Lançamento: 2026-05-01
Pontuação	8.6	8.2
Posição	#10	#20
Confiabilidade	N/D	10.0
Consistência	9.2	8.6
Testes corretos
Taxa de acerto por tentativa	83.3%	81.5%
Testes instáveis	2	3
Execuções totais	50	54
Custo por resultado	0.000	3.974
Custo total	$0.000	$0.517
Preço de entrada	$0.000 / 1M	$1.250 / 1M
Preço de saída	$0.000 / 1M	$2.500 / 1M
Tokens de saída	238,920	1,223
Tokens de raciocínio	0	187,047
Tempo de resposta (médio)	55.19s	48.63s
Tempo de resposta (máx.)	149.94s	216.69s
Tempo de resposta (total)	938.23s	875.27s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
HY3 Preview	10.0	10.0	100.0%	0		32.69s	26,550	0
Grok 4.3	10.0	10.0	100.0%	0		8.83s	88	8,207

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
HY3 Preview	10.0	10.0	100.0%	0		99.76s	38,167	0
Grok 4.3	10.0	10.0	100.0%	0		45.72s	284	9,659

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
HY3 Preview	10.0	10.0	100.0%	0		113.09s	31,319	0
Grok 4.3	10.0	10.0	100.0%	0		63.99s	234	15,301

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
HY3 Preview	6.5	10.0	50.0%	0		12.11s	4,323	0
Grok 4.3	10.0	10.0	100.0%	0		18.97s	180	9,546

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
HY3 Preview	5.3	7.2	44.4%	1		109.04s	87,559	0
Grok 4.3	5.3	7.2	44.4%	1		181.74s	14	111,300

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
HY3 Preview	10.0	10.0	100.0%	0		24.31s	5,490	0
Grok 4.3	5.4	2.5	66.7%	1		24.70s	70	5,020

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
HY3 Preview	9.9	10.0	100.0%	0		34.02s	13,331	0
Grok 4.3	9.8	10.0	100.0%	0		18.58s	57	8,713

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
HY3 Preview	9.0	7.9	88.9%	1		28.07s	21,811	0
Grok 4.3	5.9	7.2	55.6%	1		22.53s	128	14,686

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
HY3 Preview	10.0	10.0	100.0%	0		78.83s	10,370	0
Grok 4.3	10.0	10.0	100.0%	0		17.66s	168	4,615

Comparação rápida

Trocar par de comparação

Seed-2.0-LitemediumvsHY3 PreviewhighDisponível grátis GPT-5.3-CodexmediumvsHY3 PreviewhighDisponível grátis HY3 PreviewlowDisponível grátisvsGrok 4.3medium Gemini 3 Flash PreviewnonevsGrok 4.3medium Qwen3.6 35B A3BmediumvsHY3 PreviewhighDisponível grátis Qwen3.5 Plus 2026-02-15mediumvsHY3 PreviewhighDisponível grátis Gemini 3.1 Flash Lite PreviewlowvsGrok 4.3medium Qwen3.6 Plus PreviewmediumDisponível grátisvsHY3 PreviewhighDisponível grátis Qwen3.6 Max PreviewmediumvsHY3 PreviewhighDisponível grátis Gemini 3 Flash PreviewlowvsHY3 PreviewhighDisponível grátis Qwen3.5-27BmediumvsHY3 PreviewhighDisponível grátis Gemini 3 PRO PreviewmediumvsHY3 PreviewhighDisponível grátis