Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Nemotron 3 Super 120b A12b vs Qwen: Qwen3.5 Plus 2026-02-15

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-12

Métrica Nemotron 3 Super 120b A12b Nemotron 3 Super 120b A12b medium Lançamento: 2026-03-11 Disponível grátis Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none Lançamento: 2026-02-15
Posição #36 #31
Pontuação média 5.8 6.2
Consistência 8.5 9.6
Custo por resultado 0.000 0.172
Custo total $0.000 $0.016
Testes corretos
Taxa de acerto por tentativa 56.3% 58.3%
Testes instáveis 3 1
Execuções totais 48 48
Tokens de saída 11,925 2,015
Tokens de raciocínio 29,687 0
Tempo de resposta (médio) 20.24s 2.65s
Tempo de resposta (máx.) 87.80s 6.65s
Tempo de resposta (total) 303.60s 26.52s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação média vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação média vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 12.96s 1,754 3,264
Qwen3.5 Plus 2026-02-15 4.0 10.0 33.3% 0 2.74s 514 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 87.80s 2,021 9,996
Qwen3.5 Plus 2026-02-15 10.0 10.0 0.0% 0 6.65s 314 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Nemotron 3 Super 120b A12b 9.9 10.0 100.0% 0 18.16s 877 2,607
Qwen3.5 Plus 2026-02-15 9.9 10.0 100.0% 0 1.89s 243 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Nemotron 3 Super 120b A12b 10.0 4.4 22.2% 2 16.19s 5,255 6,072
Qwen3.5 Plus 2026-02-15 4.0 10.0 33.3% 0 1.17s 17 0
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Nemotron 3 Super 120b A12b 2.0 9.9 0.0% 0 27.86s 104 1,149
Qwen3.5 Plus 2026-02-15 4.0 3.0 33.3% 1 2.26s 117 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Nemotron 3 Super 120b A12b 7.0 6.5 66.7% 1 7.72s 1,042 2,479
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.67s 72 0
Puzzle Solving Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Nemotron 3 Super 120b A12b 1.3 9.8 0.0% 0 8.39s 602 2,151
Qwen3.5 Plus 2026-02-15 7.0 10.0 66.7% 0 2.82s 516 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 39.75s 270 1,969
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 3.33s 222 0

Comparação rápida

Trocar par de comparação