Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemma 4 31B vs Nemotron 3 Ultra 550b A55b

Resumo

Comparação benchmark Gemma 4 31B vs Nemotron 3 Ultra 550b A55b: Gemma 4 31B lidera na pontuação média com 6.3 vs 6.1. Nemotron 3 Ultra 550b A55b tem menor custo de benchmark com $0.028 vs $0.033. Nemotron 3 Ultra 550b A55b é mais rápido com 2.27s vs 56.55s, com taxas de acerto de 69.8% vs 44.4%.

Modelo recomendado: Nemotron 3 Ultra 550b A55b - A pontuação fica perto da melhor aqui (6.1 vs 6.3) e responde cerca de 24.9x mais rápido que Gemma 4 31B.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-12

Métrica Gemma 4 31B Gemma 4 31B medium Lançamento: 2026-04-02 Disponível grátis Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b none Lançamento: 2026-06-04 Disponível grátis
Pontuação 6.3 6.1
Posição #87 #100
Confiabilidade 10.0 10.0
Consistência 9.4 9.2
Testes corretos
Taxa de acerto por tentativa 69.8% 44.4%
Testes instáveis 1 2
Execuções totais 63 63
Custo por resultado 0.257 0.000
Custo total $0.033 $0.028
Preço de entrada $0.120 / 1M $0.500 / 1M
Preço de saída $0.350 / 1M $2.500 / 1M
Total de tokens de entrada 17,957 43,326
Tokens de saída 22,356 2,138
Tokens de raciocínio 65,726 0
Tempo de resposta (médio) 56.55s 2.27s
Tempo de resposta (máx.) 437.40s 13.49s
Tempo de resposta (total) 1074.41s 47.65s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#87 Gemma 4 31B

medium
Cost
$0.002
Time
45.7s
Tokens
2,696 tok

#100 Nemotron 3 Ultra 550b A55b

none
No showcase result has been generated for this model yet.
Cost
$0.000
Time
-
Tokens
0 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 816 962 2,046
Nemotron 3 Ultra 550b A55b 3.5 8.0 16.7% 1 2.35s 696 239 0
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 4.3 5.8 22.2% 1 219.76s 5,568 11,098 33,212
Nemotron 3 Ultra 550b A55b 5.5 10.0 33.3% 0 1.02s 7,623 369 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Nemotron 3 Ultra 550b A55b 3.0 10.0 0.0% 0 4.79s 15,558 357 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 8,334 1,822 2,951
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 1.94s 7,944 249 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 876 4,349 8,985
Nemotron 3 Ultra 550b A55b 5.3 10.0 33.3% 0 698ms 789 27 0
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 567 105 888
Nemotron 3 Ultra 550b A55b 5.0 10.0 0.0% 0 13.49s 516 101 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 777 533 2,035
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 1.46s 723 69 0
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 9.9 10.0 100.0% 0 26.91s 801 1,795 5,595
Nemotron 3 Ultra 550b A55b 5.9 7.2 55.6% 1 1.06s 726 352 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 2.99s 8,544 264 0
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 218 1,692 10,014
Nemotron 3 Ultra 550b A55b 3.0 10.0 0.0% 0 1.83s 207 111 0

Comparação rápida

Trocar par de comparação