Gemini 3 Flash Preview vs Grok Build 0.1 (medium)

Modelo recomendado Gemini 3 Flash Preview

Oferece o melhor compromisso geral: pontuação competitiva (6.8), custo menor que Grok Build 0.1 (medium) e tempo de resposta equilibrado.

Comparação detalhada

Métrica	Gemini 3 Flash Preview Gemini 3 Flash Preview none Lançamento: 2025-12-17	Grok Build 0.1 Grok Build 0.1 medium Lançamento: 2026-05-21

Métrica	Gemini 3 Flash Preview Gemini 3 Flash Preview none Lançamento: 2025-12-17	Grok Build 0.1 Grok Build 0.1 medium Lançamento: 2026-05-21
Pontuação	6.8	7.6
Posição	#97	#55
Confiabilidade	10.0	10.0
Consistência	8.9	10.0
Testes corretos
Taxa de acerto por tentativa	65.2%	63.6%
Testes instáveis	3	0
Execuções totais	66	66
Custo por resultado	0.648	7.830
Custo total	$0.085	$1.097
Preço de entrada	$0.500 / 1M	$1.000 / 1M
Preço de saída	$3.000 / 1M	$2.000 / 1M
Total de tokens de entrada	104,210	106,751
Tokens de saída	10,710	7,993
Tokens de raciocínio	0	486,670
Tempo de resposta (médio)	2.95s	52.06s
Tempo de resposta (máx.)	21.19s	252.69s
Tempo de resposta (total)	44.26s	1145.27s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

Categoria:

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3 Flash Preview	8.3	10.0	75.0%	0		1.25s	498	214	0
Grok Build 0.1	8.3	10.0	75.0%	0		7.43s	2,010	220	12,162

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3 Flash Preview	5.5	10.0	33.3%	0		1.80s	8,122	453	0
Grok Build 0.1	5.7	9.7	33.3%	0		108.46s	8,304	1,138	161,452

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3 Flash Preview	3.8	1.6	50.0%	2		12.38s	80,061	9,175	0
Grok Build 0.1	10.0	10.0	100.0%	0		65.08s	75,242	5,442	65,569

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		1.41s	7,263	279	0
Grok Build 0.1	10.0	10.0	100.0%	0		10.72s	7,761	180	8,876

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3 Flash Preview	7.7	10.0	66.7%	0		963ms	643	18	0
Grok Build 0.1	5.3	10.0	33.3%	0		158.00s	1,764	492	175,294

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		1.13s	490	104	0
Grok Build 0.1	4.4	9.9	0.0%	0		18.41s	825	76	6,345

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3 Flash Preview	6.4	5.8	66.7%	1		1.58s	619	74	0
Grok Build 0.1	9.8	10.0	100.0%	0		12.36s	1,362	57	9,599

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3 Flash Preview	7.7	10.0	66.7%	0		1.05s	574	144	0
Grok Build 0.1	7.7	10.0	66.7%	0		18.26s	1,689	195	20,841

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		3.35s	5,784	234	0
Grok Build 0.1	10.0	10.0	100.0%	0		13.12s	7,263	180	4,969

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3 Flash Preview	3.0	10.0	0.0%	0		1.07s	156	15	0
Grok Build 0.1	3.0	10.0	0.0%	0		53.51s	531	13	21,563

Trocar par de comparação