AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#107

Nemotron 3 Nano Omni 30b A3b Reasoning

NVIDIA Lançamento: 2026-04-28 Testado em: 2026-04-28 23:26 nvidia/nemotron-3-nano-omni-30b-a3b-reasoning::medium
(medium) (none)

Resumo

Nemotron 3 Nano Omni 30b A3b Reasoning marca 5.2 no AI BENCHY e fica em #107. Tem fiabilidade 10.0, taxa de acerto de 47.9%, custo total de $0.000 e tempo médio de resposta de 14.46s.

O que torna Nemotron 3 Nano Omni 30b A3b Reasoning único: Destaca-se mais em Truques anti-IA, onde fica em #1, enquanto Programação é a área mais fraca em #10. O custo total do benchmark é invulgarmente baixo para este nível de pontuação. Usa uma quantidade invulgarmente alta de tokens de raciocínio, o que pode explicar execuções mais lentas ou caras.

Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.

Consistência

5.9

Total de tokens de saída

235,283

Total de tokens de entrada

0

Preço de entrada

$0.000 / 1M

Preço de saída

$0.000 / 1M

Testes corretos

Testes errados: 12

Taxa de acerto por tentativa: 47.9%

Testes instáveis

8

Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).

Tempo de resposta (médio)

14.46s

Tempo de resposta (máx.): 147.45s

Tempo de resposta (total): 231.37s

Histórico de execuções

Testado em Pontuação Confiabilidade Testes corretos Custo total Comparar
2026-05-08 15:30 Suite alterada 4.6 10.0 $0.000 Comparar
2026-04-28 23:26 Primeira execução registrada 5.2 10.0 $0.000 Execução atual

Comparação de execuções

ExecuçãoPontuaçãoConsistênciaConfiabilidadeTestes corretosTestes instáveisTotal de tokens de saídaTotal de tokens de entradaCusto totalTempo de resposta (médio)
2026-04-28 23:26 · Primeira execução registrada5.25.910.04/168235,2830$0.00014.46s
2026-05-08 15:30 · Suite alterada4.67.810.04/195229,18611,661$0.00017.13s
Diferença+0.6-1.90.0+2+3+6097-11661$0.000-2668ms

Estas duas execuções usaram suites de benchmark diferentes, então as diferenças refletem tanto mudanças do modelo quanto da suite.

Gráficos

Escolha o primeiro modelo e depois clique em um segundo modelo para abrir uma página lado a lado.

Total de tokens de saída

Pontuação vs Total de tokens de saída

Comparação rápida

Detalhamento por categoria

Categoria Pontuação Consistência Testes corretos
Truques anti-IA 7.0 5.9
Programação 3.3 1.7
Combinado 0.0 0.0
Análise e extração de dados 7.3 5.9
Específico do domínio 2.9 7.2
Inteligência geral 4.8 9.9
Seguimento de instruções 6.9 6.3
Resolução de quebra-cabeças 3.5 4.4
Chamada de ferramentas 0.0 0.0

Modelos comparados