Comparação benchmark Nemotron 3 Ultra 550b A55b vs Laguna M.1: Nemotron 3 Ultra 550b A55b lidera na pontuação média com 8.1 vs 5.7. Laguna M.1 tem menor custo de benchmark com $0.000 vs $0.177. Laguna M.1 é mais rápido com 14.73s vs 15.05s, com taxas de acerto de 69.8% vs 52.6%.
Modelo recomendado: Nemotron 3 Ultra 550b A55b - Tem a pontuação mais forte nesta comparação (8.1) e o melhor equilíbrio geral entre custo e tempo de resposta entre os 2 modelos.
Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-12
Laguna M.1Laguna M.1mediumModelo arquivado: este modelo não é mais atualizado nem testado em novos testes.Lançamento: 2026-04-28Disponível grátis
Pontuação
8.1Pontuação média em todos os testes de benchmark.…
5.7Pontuação média em todos os testes de benchmark.…
Posição
#29
#117
Confiabilidade
9.7Pontuação de sucesso na primeira tentativa: 10.0 significa nenhum erro reexecutável da API alvo ou de limite de taxa antes de chamadas bem-sucedidas; falhas registradas reduzem a pontuação.…
10.0Pontuação de sucesso na primeira tentativa: 10.0 significa nenhum erro reexecutável da API alvo ou de limite de taxa antes de chamadas bem-sucedidas; falhas registradas reduzem a pontuação.…
Consistência
8.8A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
9.1A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
Testes corretos
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 7Erro de API: 1Tempo de resposta (médio)15.05sTempo de resposta (máx.)43.93sTempo de resposta (total)316.09sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 4Resposta incorreta: 4Não seguiu as instruções: 1Sem resposta: 1Tempo de resposta (médio)14.73sTempo de resposta (máx.)53.14sTempo de resposta (total)220.93sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
Taxa de acerto por tentativa
69.8%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
52.6%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
Testes instáveis
3Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
2Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Execuções totais
63Execuções totais…
57Execuções totais…
Custo por resultado
0.000Mostra o custo médio por resposta correta no benchmark, em centavos (quanto menor, melhor).…
0.000Mostra o custo médio por resposta correta no benchmark, em centavos (quanto menor, melhor).…
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)8.62sTempo de resposta (máx.)16.86sTempo de resposta (total)34.49sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
8.62sTempo de resposta (médio)…
780Total de tokens de entrada…
835Tokens de saída…
1,485Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
6.5Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
50.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Resposta incorreta: 1Tempo de resposta (médio)4.87sTempo de resposta (máx.)6.30sTempo de resposta (total)14.62sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
8.4Pontuação média em todos os testes de benchmark.…
7.4A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
88.9%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
1Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)26.53sTempo de resposta (máx.)31.91sTempo de resposta (total)79.58sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
26.53sTempo de resposta (médio)…
7,686Total de tokens de entrada…
2,854Tokens de saída…
17,725Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
4.3Pontuação média em todos os testes de benchmark.…
1.1A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
66.7%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
1Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)35.61sTempo de resposta (máx.)35.61sTempo de resposta (total)35.61sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
9.8Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)43.93sTempo de resposta (máx.)43.93sTempo de resposta (total)43.93sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
43.93sTempo de resposta (médio)…
17,574Total de tokens de entrada…
1,040Tokens de saída…
3,590Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
3.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
0.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)53.14sTempo de resposta (máx.)53.14sTempo de resposta (total)53.14sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.68sTempo de resposta (máx.)7.94sTempo de resposta (total)11.36sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
5.68sTempo de resposta (médio)…
7,989Total de tokens de entrada…
473Tokens de saída…
1,285Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.93sTempo de resposta (máx.)5.03sTempo de resposta (total)9.86sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
3.5Pontuação média em todos os testes de benchmark.…
4.4A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
33.3%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
2Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)24.90sTempo de resposta (máx.)34.96sTempo de resposta (total)74.71sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
24.90sTempo de resposta (médio)…
858Total de tokens de entrada…
11,169Tokens de saída…
16,249Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
5.3Pontuação média em todos os testes de benchmark.…
7.2A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
44.4%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
1Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)24.14sTempo de resposta (máx.)45.83sTempo de resposta (total)72.43sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
3.7Pontuação média em todos os testes de benchmark.…
9.5A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
0.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)2.52sTempo de resposta (máx.)2.52sTempo de resposta (total)2.52sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
2.52sTempo de resposta (médio)…
360Total de tokens de entrada…
70Tokens de saída…
235Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
3.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
0.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0msUm teste é totalmente aprovado apenas quando todas as execuções passam.…
9.8Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.35sTempo de resposta (máx.)9.38sTempo de resposta (total)12.69sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
6.35sTempo de resposta (médio)…
765Total de tokens de entrada…
182Tokens de saída…
1,243Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.30sTempo de resposta (máx.)6.00sTempo de resposta (total)8.59sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
5.5Pontuação média em todos os testes de benchmark.…
9.9A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
33.3%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)3.54sTempo de resposta (máx.)6.03sTempo de resposta (total)10.62sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
3.54sTempo de resposta (médio)…
792Total de tokens de entrada…
771Tokens de saída…
2,055Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
5.3Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
33.3%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Resposta incorreta: 1Tempo de resposta (médio)10.19sTempo de resposta (máx.)14.92sTempo de resposta (total)20.37sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)7.72sTempo de resposta (máx.)7.72sTempo de resposta (total)7.72sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
7.72sTempo de resposta (médio)…
9,781Total de tokens de entrada…
304Tokens de saída…
984Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.31sTempo de resposta (máx.)6.31sTempo de resposta (total)6.31sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
3.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
0.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)38.47sTempo de resposta (máx.)38.47sTempo de resposta (total)38.47sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
38.47sTempo de resposta (médio)…
228Total de tokens de entrada…
304Tokens de saída…
8,240Tokens de raciocínio…
Laguna M.1Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
3.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
0.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0msUm teste é totalmente aprovado apenas quando todas as execuções passam.…