Step 3.7 Flash (high) vs GLM 5.1 (medium)

Modelo recomendado GLM 5.1 (medium)

Tem a melhor pontuação aqui (7.1) e custa cerca de 2.3x menos que Step 3.7 Flash (high).

Comparação detalhada

Métrica	Step 3.7 Flash Step 3.7 Flash high Lançamento: 2026-05-29	GLM 5.1 GLM 5.1 medium Lançamento: 2026-04-07

Métrica	Step 3.7 Flash Step 3.7 Flash high Lançamento: 2026-05-29	GLM 5.1 GLM 5.1 medium Lançamento: 2026-04-07
Pontuação	6.9	7.1
Posição	#94	#82
Confiabilidade	10.0	8.3
Consistência	8.0	8.4
Testes corretos
Taxa de acerto por tentativa	63.6%	69.7%
Testes instáveis	5	4
Execuções totais	66	66
Custo por resultado	10.973	4.202
Custo total	$1.207	$0.535
Preço de entrada	$0.200 / 1M	$0.966 / 1M
Preço de saída	$1.150 / 1M	$3.036 / 1M
Total de tokens de entrada	98,691	82,623
Tokens de saída	1,032,395	16,089
Tokens de raciocínio	0	136,463
Tempo de resposta (médio)	64.68s	46.77s
Tempo de resposta (máx.)	364.99s	308.75s
Tempo de resposta (total)	1423.01s	982.16s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

high

medium

SVG inválido

Categoria:

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Step 3.7 Flash	10.0	10.0	100.0%	0		13.40s	696	42,656	0
GLM 5.1	10.0	10.0	100.0%	0		8.31s	555	401	5,122

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Step 3.7 Flash	4.0	6.0	22.2%	1		206.21s	6,057	327,340	0
GLM 5.1	4.6	3.7	44.5%	2		109.63s	5,702	4,871	37,826

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Step 3.7 Flash	8.7	6.9	83.3%	1		41.23s	73,938	49,842	0
GLM 5.1	9.8	10.0	100.0%	0		175.93s	66,926	4,761	65,248

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Step 3.7 Flash	10.0	10.0	100.0%	0		14.72s	7,368	23,113	0
GLM 5.1	10.0	10.0	100.0%	0		9.33s	7,107	991	4,552

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Step 3.7 Flash	4.1	4.4	44.5%	2		149.64s	783	410,502	0
GLM 5.1	5.3	10.0	33.3%	0		29.77s	489	969	11,314

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Step 3.7 Flash	5.5	10.0	0.0%	0		4.17s	510	2,862	0
GLM 5.1	10.0	10.0	100.0%	0		20.95s	477	2,875	2,875

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Step 3.7 Flash	9.8	10.0	100.0%	0		1.52s	705	2,010	0
GLM 5.1	6.4	5.8	66.7%	1		7.47s	634	204	1,617

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Step 3.7 Flash	5.3	7.2	44.4%	1		10.22s	711	25,422	0
GLM 5.1	8.2	7.2	88.9%	1		31.64s	609	935	5,730

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Step 3.7 Flash	10.0	10.0	100.0%	0		2.79s	7,701	1,172	0
GLM 5.1	3.0	10.0	0.0%	0		0ms	0	0	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Step 3.7 Flash	3.0	10.0	0.0%	0		149.34s	222	147,476	0
GLM 5.1	3.0	10.0	0.0%	0		29.40s	124	82	2,179

Trocar par de comparação