Google: Gemini 3.1 Flash Lite Preview vs Z.ai: GLM 5.1

GLM 5.1 (medium) lidera na pontuação média com 7.1 vs 6.4. Gemini 3.1 Flash Lite Preview tem menor custo de benchmark com $0.052 vs $0.535. Gemini 3.1 Flash Lite Preview é mais rápido com 1.58s vs 46.77s, com taxas de acerto de 57.6% vs 69.7%.

Modelo recomendadoGemini 3.1 Flash Lite PreviewA pontuação fica perto da melhor aqui (6.4 vs 7.1) e custa cerca de 10.3x menos que GLM 5.1 (medium).

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-07-25

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Lançamento: 2026-03-03	GLM 5.1 GLM 5.1 medium Lançamento: 2026-04-07

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Lançamento: 2026-03-03	GLM 5.1 GLM 5.1 medium Lançamento: 2026-04-07
Pontuação	6.4	7.1
Posição	#116	#82
Confiabilidade	10.0	8.3
Consistência	9.7	8.4
Testes corretos
Taxa de acerto por tentativa	57.6%	69.7%
Testes instáveis	1	4
Execuções totais	66	66
Custo por resultado	0.431	4.202
Custo total	$0.052	$0.535
Preço de entrada	$0.250 / 1M	$0.966 / 1M
Preço de saída	$1.500 / 1M	$3.036 / 1M
Total de tokens de entrada	120,942	82,623
Tokens de saída	14,292	16,089
Tokens de raciocínio	0	136,463
Tempo de resposta (médio)	1.58s	46.77s
Tempo de resposta (máx.)	9.27s	308.75s
Tempo de resposta (total)	34.72s	982.16s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#116 Gemini 3.1 Flash Lite Preview

none

Custo: $0.003
Tempo: 4.7s
Tokens: 1,827 tok

#82 GLM 5.1

medium

SVG inválido

Custo: $0.000
Tempo: 300.0s
Tokens: 0 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Categoria:

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	7.5	8.4	66.7%	1		1.04s	504	1,092	0
GLM 5.1	10.0	10.0	100.0%	0		8.31s	555	401	5,122

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		967ms	8,128	670	0
GLM 5.1	4.6	3.7	44.5%	2		109.63s	5,702	4,871	37,826

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		6.23s	96,386	9,084	0
GLM 5.1	9.8	10.0	100.0%	0		175.93s	66,926	4,761	65,248

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.22s	7,550	399	0
GLM 5.1	10.0	10.0	100.0%	0		9.33s	7,107	991	4,552

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		942ms	641	568	0
GLM 5.1	5.3	10.0	33.3%	0		29.77s	489	969	11,314

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		741ms	488	69	0
GLM 5.1	10.0	10.0	100.0%	0		20.95s	477	2,875	2,875

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.13s	623	574	0
GLM 5.1	6.4	5.8	66.7%	1		7.47s	634	204	1,617

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		900ms	570	1,045	0
GLM 5.1	8.2	7.2	88.9%	1		31.64s	609	935	5,730

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.39s	5,894	782	0
GLM 5.1	3.0	10.0	0.0%	0		0ms	0	0	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		814ms	158	9	0
GLM 5.1	3.0	10.0	0.0%	0		29.40s	124	82	2,179

Comparação rápida

Trocar par de comparação

Qwen3.7 PlusnonevsGLM 5.1medium Gemini 3.1 Flash Lite PreviewnonevsLaguna XS 2.1mediumDisponível grátis Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2.5medium Gemini 3.1 Flash Lite PreviewnonevsLing 3.0 FlashhighDisponível grátis Gemini 3.1 Flash Lite PreviewnonevsQwen3.6 27Bmedium Gemini 3.1 Flash Lite PreviewnonevsRing-2.6-1Tmedium KAT-Coder-Pro V2.5highvsGLM 5.1medium Step 3.7 FlashlowvsGLM 5.1medium Gemini 3.5 FlashnonevsGLM 5.1medium Claude Opus 4.8nonevsGLM 5.1medium Gemini 3.1 Flash Lite PreviewnonevsLongCat 2.0high Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-Flashmedium