AI BENCHY Compare

IBM: Granite 4.1 8B vs Mistral: Mistral Small 4

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-29

Métrica	Granite 4.1 8B Granite 4.1 8B none Lançamento: 2026-05-01	Mistral Small 4 Mistral Small 4 none Lançamento: 2026-03-16

Métrica	Granite 4.1 8B Granite 4.1 8B none Lançamento: 2026-05-01	Mistral Small 4 Mistral Small 4 none Lançamento: 2026-03-16
Pontuação	4.1	5.0
Posição	#158	#140
Confiabilidade	10.0	10.0
Consistência	10.0	9.5
Testes corretos
Taxa de acerto por tentativa	10.0%	28.3%
Testes instáveis	0	1
Execuções totais	60	60
Custo por resultado	0.122	0.131
Custo total	$0.003	$0.007
Preço de entrada	$0.050 / 1M	$0.150 / 1M
Preço de saída	$0.100 / 1M	$0.600 / 1M
Tokens de saída	2,743	2,192
Tokens de raciocínio	0	0
Tempo de resposta (médio)	719ms	629ms
Tempo de resposta (máx.)	2.17s	1.72s
Tempo de resposta (total)	14.37s	12.59s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Granite 4.1 8B	4.9	10.0	25.0%	0		844ms	903	0
Mistral Small 4	3.4	7.9	16.7%	1		395ms	182	0

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Granite 4.1 8B	5.2	10.0	0.0%	0		706ms	357	0
Mistral Small 4	4.0	9.5	0.0%	0		1.03s	610	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Granite 4.1 8B	3.0	10.0	0.0%	0		1.88s	396	0
Mistral Small 4	3.0	10.0	0.0%	0		1.72s	496	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Granite 4.1 8B	3.0	10.0	0.0%	0		575ms	195	0
Mistral Small 4	10.0	10.0	100.0%	0		822ms	261	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Granite 4.1 8B	3.0	10.0	0.0%	0		357ms	24	0
Mistral Small 4	5.3	10.0	33.3%	0		367ms	28	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Granite 4.1 8B	4.0	10.0	0.0%	0		499ms	115	0
Mistral Small 4	4.0	10.0	0.0%	0		729ms	205	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Granite 4.1 8B	3.6	9.9	0.0%	0		344ms	66	0
Mistral Small 4	6.5	10.0	50.0%	0		380ms	69	0

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Granite 4.1 8B	3.2	10.0	0.0%	0		608ms	432	0
Mistral Small 4	3.1	9.9	0.0%	0		399ms	111	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Granite 4.1 8B	10.0	10.0	100.0%	0		2.17s	243	0
Mistral Small 4	10.0	10.0	100.0%	0		1.40s	213	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Granite 4.1 8B	3.0	10.0	0.0%	0		306ms	12	0
Mistral Small 4	3.0	10.0	0.0%	0		397ms	17	0

Comparação rápida

Trocar par de comparação

Granite 4.1 8BnonevsQwen3.5-9Bmedium Mistral Small 4nonevsQwen3 Coder Nextmedium Granite 4.1 8BnonevsGLM 4.7 Flashmedium MiniMax M2.7mediumvsMistral Small 4none Mistral Small 4nonevsElephant Alphamedium MiniMax M2.5mediumDisponível grátisvsMistral Small 4none Mistral Small 4nonevsGLM 4.7 Flashmedium Granite 4.1 8BnonevsQwen3 Coder Nextmedium Mistral Small 4nonevsQwen3.5-9Bmedium CobuddymediumvsMistral Small 4none Mistral Small 4nonevsOwl Alphamedium Mistral Small 4nonevsgpt-oss-120bmediumDisponível grátis