Comparar Gráficos

Idioma:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs xAI: Grok 4.1 Fast

Comparar:

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-03

Métrica	Google: Gemini 3.1 Flash Lite Preview none Lançamento: 2026-03-03	xAI: Grok 4.1 Fast medium Lançamento: 2025-11-19
Posição	#10	#24
Pontuação média	7.70	6.29
Consistência	9.54	8.20
Custo por resultado	0.116	0.532
Custo total	$0.011	$0.043
Testes corretos
Taxa de acerto por tentativa	69.1%	66.7%
Testes instáveis	1	3
Tokens de saída	4,307	793
Tokens de raciocínio	0	74,056

Melhores modelos por pontuação

Pontuação vs custo total

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	6.00	7.85	55.6%	1		1,086	0
xAI: Grok 4.1 Fast	10.00	10.00	100.0%	0		102	4,021

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	9.88	10.00	100.0%	0		399	0
xAI: Grok 4.1 Fast	10.00	10.00	100.0%	0		180	5,472

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	4.00	10.00	33.3%	0		568	0
xAI: Grok 4.1 Fast	4.00	7.21	55.6%	1		12	40,547

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	9.00	10.00	50.0%	0		574	0
xAI: Grok 4.1 Fast	5.50	10.00	50.0%	0		48	3,151

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		898	0
xAI: Grok 4.1 Fast	4.67	7.20	44.4%	1		191	9,380

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		782	0
xAI: Grok 4.1 Fast	1.00	1.62	33.3%	1		260	11,485

Comparação rápida

Trocar par de comparação

Qwen3.5 Plus 2026-02-15nonevsGrok 4.1 Fastmedium Claude Sonnet 4.6nonevsGrok 4.1 Fastmedium Grok 4.1 FastmediumvsGLM 5none Gemini 3.1 Flash Lite PreviewnonevsGPT-5.3-Codexmedium Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewnonevsGLM 5medium Gemini 3.1 Flash Lite PreviewnonevsStep 3.5 FlashmediumDisponível grátis DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewnonevsGPT-5.2medium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-27Bmedium Gemini 3 Flash PreviewnonevsGrok 4.1 Fastmedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-122B-A10Bmedium