Navegação
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Nemotron 3 Ultra 550b A55b

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-04

Métrica DeepSeek V4 Pro DeepSeek V4 Pro high Lançamento: 2026-04-24 Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b none Lançamento: 2026-06-04 Disponível grátis
Pontuação 6.0 6.0
Posição #103 #104
Confiabilidade 9.0 10.0
Consistência 7.6 9.2
Testes corretos
Taxa de acerto por tentativa 52.4% 44.4%
Testes instáveis 6 2
Execuções totais 63 63
Custo por resultado 2.869 0.000
Custo total $0.079 $0.000
Preço de entrada $0.435 / 1M $0.000 / 1M
Preço de saída $0.870 / 1M $0.000 / 1M
Total de tokens de entrada 32,240 43,326
Tokens de saída 12,250 2,138
Tokens de raciocínio 72,257 0
Tempo de resposta (médio) 65.21s 2.27s
Tempo de resposta (máx.) 358.35s 13.49s
Tempo de resposta (total) 1304.19s 47.65s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 6.4 7.9 58.3% 1 16.53s 448 71 3,617
Nemotron 3 Ultra 550b A55b 3.5 8.0 16.7% 1 2.35s 696 239 0
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 3.3 6.4 11.1% 1 118.23s 1,966 111 20,940
Nemotron 3 Ultra 550b A55b 5.5 10.0 33.3% 0 1.02s 7,623 369 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 10.0 10.0 100.0% 0 65.02s 14,016 465 5,914
Nemotron 3 Ultra 550b A55b 3.0 10.0 0.0% 0 4.79s 15,558 357 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 7.3 5.9 83.3% 1 23.62s 5,633 229 1,710
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 1.94s 7,944 249 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 2.9 7.2 11.1% 1 205.66s 430 10,529 28,089
Nemotron 3 Ultra 550b A55b 5.3 10.0 33.3% 0 698ms 789 27 0
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 6.1 3.1 66.7% 1 25.09s 314 76 1,152
Nemotron 3 Ultra 550b A55b 5.0 10.0 0.0% 0 13.49s 516 101 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 10.0 10.0 100.0% 0 41.16s 627 205 2,416
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 1.46s 723 69 0
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 5.9 7.2 55.6% 1 34.84s 544 139 4,019
Nemotron 3 Ultra 550b A55b 5.9 7.2 55.6% 1 1.06s 726 352 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 10.0 10.0 100.0% 0 21.33s 8,079 372 593
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 2.99s 8,544 264 0
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 3.0 10.0 0.0% 0 39.14s 183 53 3,807
Nemotron 3 Ultra 550b A55b 3.0 10.0 0.0% 0 1.83s 207 111 0

Comparação rápida

Trocar par de comparação