AI BENCHY Compare

Elephant Alpha vs Z.ai: GLM 4.7 Flash

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-29

Métrica	Elephant Alpha Elephant Alpha none Lançamento: 2026-04-14	GLM 4.7 Flash GLM 4.7 Flash medium Lançamento: 2026-01-19

Métrica	Elephant Alpha Elephant Alpha none Lançamento: 2026-04-14	GLM 4.7 Flash GLM 4.7 Flash medium Lançamento: 2026-01-19
Pontuação	5.2	4.5
Posição	#136	#154
Confiabilidade	N/D	10.0
Consistência	9.6	6.7
Testes corretos
Taxa de acerto por tentativa	29.8%	35.0%
Testes instáveis	1	8
Execuções totais	60	60
Custo por resultado	0.000	1.337
Custo total	$0.000	$0.054
Preço de entrada	$0.000 / 1M	$0.060 / 1M
Preço de saída	$0.000 / 1M	$0.400 / 1M
Tokens de saída	2,573	43,754
Tokens de raciocínio	0	89,079
Tempo de resposta (médio)	1.22s	35.10s
Tempo de resposta (máx.)	3.81s	174.55s
Tempo de resposta (total)	22.03s	456.24s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Elephant Alpha	6.6	10.0	50.0%	0		963ms	610	0
GLM 4.7 Flash	4.7	5.9	41.7%	2		14.95s	1,122	6,110

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Elephant Alpha	4.7	6.7	33.3%	1		1.39s	375	0
GLM 4.7 Flash	3.4	6.0	16.7%	1		55.33s	4,981	22,387

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Elephant Alpha	3.0	10.0	0.0%	0		3.81s	731	0
GLM 4.7 Flash	2.8	2.1	33.3%	1		65.57s	2,585	20,648

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Elephant Alpha	6.5	10.0	50.0%	0		1.04s	246	0
GLM 4.7 Flash	6.3	10.0	50.0%	0		1.51s	584	2,755

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Elephant Alpha	3.0	10.0	0.0%	0		927ms	24	0
GLM 4.7 Flash	3.5	4.4	33.3%	2		174.55s	33,000	25,394

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Elephant Alpha	4.0	10.0	0.0%	0		854ms	106	0
GLM 4.7 Flash	3.6	9.7	0.0%	0		18.14s	18	2,138

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Elephant Alpha	9.8	10.0	100.0%	0		1.03s	81	0
GLM 4.7 Flash	6.2	5.8	66.7%	1		2.97s	388	2,181

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Elephant Alpha	4.2	10.0	0.0%	0		807ms	170	0
GLM 4.7 Flash	2.9	7.2	11.1%	1		12.93s	781	5,255

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Elephant Alpha	3.0	10.0	0.0%	0		2.79s	230	0
GLM 4.7 Flash	10.0	10.0	100.0%	0		15.95s	224	1,014

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Elephant Alpha	0.0	0.0	0.0%	0		0ms	0	0
GLM 4.7 Flash	3.0	10.0	0.0%	0		11.13s	71	1,197

Comparação rápida

Trocar par de comparação

Ling-2.6-1TnonevsGLM 4.7 Flashmedium MiniMax M2.7mediumvsElephant Alphanone Mercury 2nonevsGLM 4.7 Flashmedium Mistral Small 4mediumvsElephant Alphanone MiniMax M2.5mediumDisponível grátisvsElephant Alphanone MiMo-V2-FlashnonevsGLM 4.7 Flashmedium Qwen3.5-9BnonevsGLM 4.7 Flashmedium GPT-5.4 NanononevsGLM 4.7 Flashmedium Trinity Large PreviewnonevsGLM 4.7 Flashmedium Granite 4.1 8BnonevsGLM 4.7 Flashmedium GPT-4o-mininonevsGLM 4.7 Flashmedium Qwen3.6 35B A3BnonevsGLM 4.7 Flashmedium