AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs Z.ai: GLM 5 Turbo

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-22

Métrica	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite high Lançamento: 2026-05-08	GLM 5 Turbo GLM 5 Turbo medium Lançamento: 2026-03-15

Métrica	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite high Lançamento: 2026-05-08	GLM 5 Turbo GLM 5 Turbo medium Lançamento: 2026-03-15
Pontuação	7.5	7.9
Posição	#48	#28
Confiabilidade	9.8	8.3
Consistência	8.1	8.1
Testes corretos
Taxa de acerto por tentativa	74.1%	76.7%
Testes instáveis	4	5
Execuções totais	54	60
Custo por resultado	18.579	1.872
Custo total	$2.044	$0.244
Preço de entrada	$0.250 / 1M	$1.200 / 1M
Preço de saída	$1.500 / 1M	$4.000 / 1M
Tokens de saída	1,984	12,231
Tokens de raciocínio	1,355,583	53,558
Tempo de resposta (médio)	61.96s	22.69s
Tempo de resposta (máx.)	149.23s	194.23s
Tempo de resposta (total)	1115.31s	453.72s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	9.4	10.0	100.0%	0		37.16s	100	130,598
GLM 5 Turbo	10.0	10.0	100.0%	0		4.82s	362	3,137

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		137.63s	666	188,733
GLM 5 Turbo	7.3	5.8	83.3%	1		53.92s	346	16,607

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		149.23s	327	198,243
GLM 5 Turbo	10.0	10.0	100.0%	0		13.88s	390	2,037

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		4.49s	279	7,351
GLM 5 Turbo	10.0	10.0	100.0%	0		6.19s	577	3,632

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	3.6	7.2	22.2%	1		139.90s	18	566,210
GLM 5 Turbo	2.9	4.4	22.2%	2		71.07s	9,665	19,279

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	5.0	2.1	66.7%	1		45.69s	95	64,644
GLM 5 Turbo	6.1	3.1	66.7%	1		10.05s	60	2,216

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	7.3	5.8	83.3%	1		23.26s	52	3,549
GLM 5 Turbo	10.0	10.0	100.0%	0		5.38s	255	2,183

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	5.7	6.8	44.4%	1		50.83s	213	193,654
GLM 5 Turbo	8.7	7.9	77.8%	1		5.44s	315	2,702

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		6.44s	234	2,601
GLM 5 Turbo	10.0	10.0	100.0%	0		9.84s	241	446

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	-	-	-	-	-	-	-	-
GLM 5 Turbo	3.0	10.0	0.0%	0		40.17s	20	1,319

Comparação rápida

Trocar par de comparação

Qwen3.7 MaxnonevsGLM 5 Turbomedium Gemini 3.5 FlashminimalvsGLM 5 Turbomedium Gemini 3 Flash PreviewnonevsGLM 5 Turbomedium Gemini 3.1 Flash Lite PreviewlowvsGLM 5 Turbomedium GPT-5.2 ChatnonevsGLM 5 Turbomedium Gemini 3.1 Flash Lite PreviewnonevsGLM 5 Turbomedium Gemini 3.1 Flash LitelowvsGLM 5 Turbomedium GPT-5.3 ChatnonevsGLM 5 Turbomedium DeepSeek V4 FlashhighDisponível grátisvsGLM 5 Turbomedium Ring-2.6-1TnonevsGLM 5 Turbomedium Gemini 3 Flash PreviewlowvsGLM 5 Turbomedium Qwen3.6 Max PreviewnonevsGLM 5 Turbomedium