Navegação
AI BENCHY
Advertise here

AI BENCHY Compare

IBM: Granite 4.1 8B vs inclusionAI: Ling-2.6-flash

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-29

Métrica Granite 4.1 8B Granite 4.1 8B none Lançamento: 2026-05-01 Ling-2.6-flash Ling-2.6-flash none Lançamento: 2026-04-21
Pontuação 4.1 5.3
Posição #158 #135
Confiabilidade 10.0 10.0
Consistência 10.0 9.2
Testes corretos
Taxa de acerto por tentativa 10.0% 35.1%
Testes instáveis 0 2
Execuções totais 60 60
Custo por resultado 0.122 0.005
Custo total $0.003 $0.001
Preço de entrada $0.050 / 1M $0.010 / 1M
Preço de saída $0.100 / 1M $0.030 / 1M
Tokens de saída 2,743 2,878
Tokens de raciocínio 0 0
Tempo de resposta (médio) 719ms 9.34s
Tempo de resposta (máx.) 2.17s 35.34s
Tempo de resposta (total) 14.37s 177.48s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 903 0
Ling-2.6-flash 6.8 8.1 58.3% 1 11.81s 573 0
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Granite 4.1 8B 5.2 10.0 0.0% 0 706ms 357 0
Ling-2.6-flash 10.0 10.0 100.0% 0 11.21s 381 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 396 0
Ling-2.6-flash 3.0 10.0 0.0% 0 35.34s 1,069 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 195 0
Ling-2.6-flash 6.5 10.0 50.0% 0 8.48s 246 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 24 0
Ling-2.6-flash 3.0 10.0 0.0% 0 4.95s 24 0
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 115 0
Ling-2.6-flash 4.0 10.0 0.0% 0 1.45s 109 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 66 0
Ling-2.6-flash 9.8 10.0 100.0% 0 5.52s 81 0
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Granite 4.1 8B 3.2 10.0 0.0% 0 608ms 432 0
Ling-2.6-flash 2.9 7.2 11.1% 1 6.51s 151 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 243 0
Ling-2.6-flash 3.0 10.0 0.0% 0 18.80s 229 0
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Granite 4.1 8B 3.0 10.0 0.0% 0 306ms 12 0
Ling-2.6-flash 3.0 10.0 0.0% 0 1.06s 15 0

Comparação rápida

Trocar par de comparação