Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 5 vs Nemotron 3 Ultra 550b A55b

Resumo

Comparação benchmark Claude Sonnet 5 vs Nemotron 3 Ultra 550b A55b: Nemotron 3 Ultra 550b A55b lidera na pontuação média com 6.1 vs 5.7. Nemotron 3 Ultra 550b A55b tem menor custo de benchmark com $0.027 vs $0.287. Nemotron 3 Ultra 550b A55b é mais rápido com 2.27s vs 4.74s, com taxas de acerto de 42.9% vs 44.4%.

Modelo recomendado: Nemotron 3 Ultra 550b A55b - Tem a melhor pontuação aqui (6.1) e custa cerca de 10.9x menos que Claude Sonnet 5.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-30

Métrica Claude Sonnet 5 Claude Sonnet 5 none Lançamento: 2026-06-30 Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b none Lançamento: 2026-06-04 Disponível grátis
Pontuação 5.7 6.1
Posição #117 #101
Confiabilidade 10.0 10.0
Consistência 8.6 9.2
Testes corretos
Taxa de acerto por tentativa 42.9% 44.4%
Testes instáveis 4 2
Execuções totais 63 63
Custo por resultado 4.098 0.000
Custo total $0.287 $0.027
Preço de entrada $2.000 / 1M $0.500 / 1M
Preço de saída $10.000 / 1M $2.200 / 1M
Total de tokens de entrada 76,797 43,326
Tokens de saída 13,325 2,138
Tokens de raciocínio 0 0
Tempo de resposta (médio) 4.74s 2.27s
Tempo de resposta (máx.) 29.46s 13.49s
Tempo de resposta (total) 99.46s 47.65s

Geração showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 Claude Sonnet 5

none
Custo
$0.061
Tempo
53.7s
Tokens
6,172 tok

#101 Nemotron 3 Ultra 550b A55b

none
Custo
$0.000
Tempo
149.6s
Tokens
3,405 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Claude Sonnet 5 5.3 10.0 25.0% 0 3.60s 834 1,813 0
Nemotron 3 Ultra 550b A55b 3.5 8.0 16.7% 1 2.35s 696 239 0
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Claude Sonnet 5 4.6 7.9 22.2% 1 3.67s 10,590 1,864 0
Nemotron 3 Ultra 550b A55b 5.5 10.0 33.3% 0 1.02s 7,623 369 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Claude Sonnet 5 3.0 10.0 0.0% 0 29.46s 38,775 6,340 0
Nemotron 3 Ultra 550b A55b 3.0 10.0 0.0% 0 4.79s 15,558 357 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Claude Sonnet 5 10.0 10.0 100.0% 0 3.01s 10,503 309 0
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 1.94s 7,944 249 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Claude Sonnet 5 5.3 7.2 44.4% 1 3.28s 975 933 0
Nemotron 3 Ultra 550b A55b 5.3 10.0 33.3% 0 698ms 789 27 0
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Claude Sonnet 5 4.7 3.1 33.3% 1 2.81s 708 272 0
Nemotron 3 Ultra 550b A55b 5.0 10.0 0.0% 0 13.49s 516 101 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Claude Sonnet 5 6.4 10.0 50.0% 0 2.58s 909 103 0
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 1.46s 723 69 0
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Claude Sonnet 5 6.0 7.4 55.6% 1 3.22s 894 778 0
Nemotron 3 Ultra 550b A55b 5.9 7.2 55.6% 1 1.06s 726 352 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Claude Sonnet 5 10.0 10.0 100.0% 0 6.80s 12,351 522 0
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 2.99s 8,544 264 0
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Claude Sonnet 5 3.0 10.0 0.0% 0 4.31s 258 391 0
Nemotron 3 Ultra 550b A55b 3.0 10.0 0.0% 0 1.83s 207 111 0

Comparação rápida

Trocar par de comparação