Comparação benchmark Nemotron 3 Ultra 550b A55b vs Laguna M.1: Nemotron 3 Ultra 550b A55b lidera na pontuação média com 8.1 vs 6.0. Laguna M.1 tem menor custo de benchmark com $0.000 vs $0.177. Laguna M.1 é mais rápido com 2.89s vs 15.05s, com taxas de acerto de 69.8% vs 31.6%.
Modelo recomendado: Nemotron 3 Ultra 550b A55b - Tem a pontuação mais forte nesta comparação (8.1) e o melhor equilíbrio geral entre custo e tempo de resposta entre os 2 modelos.
Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-12
Laguna M.1Laguna M.1noneModelo arquivado: este modelo não é mais atualizado nem testado em novos testes.Lançamento: 2026-04-28Disponível grátis
Pontuação
8.1Pontuação média em todos os testes de benchmark.…
6.0Pontuação média em todos os testes de benchmark.…
Posição
#29
#101
Confiabilidade
9.7Pontuação de sucesso na primeira tentativa: 10.0 significa nenhum erro reexecutável da API alvo ou de limite de taxa antes de chamadas bem-sucedidas; falhas registradas reduzem a pontuação.…
9.8Pontuação de sucesso na primeira tentativa: 10.0 significa nenhum erro reexecutável da API alvo ou de limite de taxa antes de chamadas bem-sucedidas; falhas registradas reduzem a pontuação.…
Consistência
8.8A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
8.8A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
Testes corretos
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 7Erro de API: 1Tempo de resposta (médio)15.05sTempo de resposta (máx.)43.93sTempo de resposta (total)316.09sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 10Erro de API: 4Chamada de ferramenta inválida: 1Tempo de resposta (médio)2.89sTempo de resposta (máx.)15.42sTempo de resposta (total)43.28sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
Taxa de acerto por tentativa
69.8%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
31.6%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
Testes instáveis
3Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
3Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Execuções totais
63Execuções totais…
57Execuções totais…
Custo por resultado
0.000Mostra o custo médio por resposta correta no benchmark, em centavos (quanto menor, melhor).…
0.000Mostra o custo médio por resposta correta no benchmark, em centavos (quanto menor, melhor).…
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)8.62sTempo de resposta (máx.)16.86sTempo de resposta (total)34.49sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
8.62sTempo de resposta (médio)…
780Total de tokens de entrada…
835Tokens de saída…
1,485Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
3.4Pontuação média em todos os testes de benchmark.…
7.9A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
16.7%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
1Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Erro de API: 1Tempo de resposta (médio)705msTempo de resposta (máx.)975msTempo de resposta (total)2.12sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
8.4Pontuação média em todos os testes de benchmark.…
7.4A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
88.9%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
1Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)26.53sTempo de resposta (máx.)31.91sTempo de resposta (total)79.58sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
26.53sTempo de resposta (médio)…
7,686Total de tokens de entrada…
2,854Tokens de saída…
17,725Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
7.5Pontuação média em todos os testes de benchmark.…
3.8A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
66.7%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
1Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.93sTempo de resposta (máx.)2.93sTempo de resposta (total)2.93sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
9.8Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)43.93sTempo de resposta (máx.)43.93sTempo de resposta (total)43.93sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
43.93sTempo de resposta (médio)…
17,574Total de tokens de entrada…
1,040Tokens de saída…
3,590Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
3.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
0.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)4.32sTempo de resposta (máx.)4.32sTempo de resposta (total)4.32sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.68sTempo de resposta (máx.)7.94sTempo de resposta (total)11.36sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
5.68sTempo de resposta (médio)…
7,989Total de tokens de entrada…
473Tokens de saída…
1,285Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.37sTempo de resposta (máx.)5.76sTempo de resposta (total)6.73sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
3.5Pontuação média em todos os testes de benchmark.…
4.4A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
33.3%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
2Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)24.90sTempo de resposta (máx.)34.96sTempo de resposta (total)74.71sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
24.90sTempo de resposta (médio)…
858Total de tokens de entrada…
11,169Tokens de saída…
16,249Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
3.6Pontuação média em todos os testes de benchmark.…
7.2A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
22.2%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
1Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)5.50sTempo de resposta (máx.)15.42sTempo de resposta (total)16.50sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
3.7Pontuação média em todos os testes de benchmark.…
9.5A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
0.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)2.52sTempo de resposta (máx.)2.52sTempo de resposta (total)2.52sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
2.52sTempo de resposta (médio)…
360Total de tokens de entrada…
70Tokens de saída…
235Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
3.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
0.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0msUm teste é totalmente aprovado apenas quando todas as execuções passam.…
9.8Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.35sTempo de resposta (máx.)9.38sTempo de resposta (total)12.69sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
6.35sTempo de resposta (médio)…
765Total de tokens de entrada…
182Tokens de saída…
1,243Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
6.3Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
50.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)683msTempo de resposta (máx.)691msTempo de resposta (total)1.37sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
5.5Pontuação média em todos os testes de benchmark.…
9.9A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
33.3%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)3.54sTempo de resposta (máx.)6.03sTempo de resposta (total)10.62sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
3.54sTempo de resposta (médio)…
792Total de tokens de entrada…
771Tokens de saída…
2,055Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
3.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
0.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Erro de API: 1Tempo de resposta (médio)891msTempo de resposta (máx.)1.21sTempo de resposta (total)1.78sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)7.72sTempo de resposta (máx.)7.72sTempo de resposta (total)7.72sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
7.72sTempo de resposta (médio)…
9,781Total de tokens de entrada…
304Tokens de saída…
984Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)7.54sTempo de resposta (máx.)7.54sTempo de resposta (total)7.54sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
3.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
0.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)38.47sTempo de resposta (máx.)38.47sTempo de resposta (total)38.47sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
38.47sTempo de resposta (médio)…
228Total de tokens de entrada…
304Tokens de saída…
8,240Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
3.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
0.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0msUm teste é totalmente aprovado apenas quando todas as execuções passam.…