Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Hunter Alpha vs Qwen: Qwen3.5-122B-A10B

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-12

Métrica Hunter Alpha Hunter Alpha medium Lançamento: Data de lançamento desconhecida Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Lançamento: 2026-02-24
Posição #35 #44
Pontuação média 5.9 5.0
Consistência 7.6 9.6
Custo por resultado 0.000 0.333
Custo total $0.000 $0.020
Testes corretos
Taxa de acerto por tentativa 68.8% 39.6%
Testes instáveis 5 1
Execuções totais 48 48
Tokens de saída 4,686 2,679
Tokens de raciocínio 17,821 0
Tempo de resposta (médio) 10.71s 3.72s
Tempo de resposta (máx.) 30.53s 46.00s
Tempo de resposta (total) 171.41s 59.46s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação média vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação média vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Hunter Alpha 7.0 7.2 88.9% 1 4.93s 441 1,003
Qwen3.5-122B-A10B 4.0 10.0 33.3% 0 927ms 309 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Hunter Alpha 10.0 1.6 66.7% 1 30.53s 792 3,456
Qwen3.5-122B-A10B 10.0 10.0 0.0% 0 46.00s 1,137 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Hunter Alpha 9.9 10.0 100.0% 0 23.16s 1,488 8,017
Qwen3.5-122B-A10B 9.9 10.0 100.0% 0 1.01s 243 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Hunter Alpha 10.0 10.0 0.0% 0 10.52s 892 2,406
Qwen3.5-122B-A10B 4.0 10.0 33.3% 0 465ms 15 0
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Hunter Alpha 8.0 3.7 66.7% 1 6.44s 116 260
Qwen3.5-122B-A10B 5.0 10.0 0.0% 0 1.12s 66 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Hunter Alpha 9.5 10.0 100.0% 0 4.18s 208 465
Qwen3.5-122B-A10B 4.5 6.8 16.7% 1 585ms 70 0
Puzzle Solving Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Hunter Alpha 4.3 4.7 66.7% 2 5.36s 441 1,310
Qwen3.5-122B-A10B 4.0 10.0 33.3% 0 982ms 575 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Hunter Alpha 10.0 10.0 100.0% 0 17.33s 308 904
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 2.04s 264 0

Comparação rápida

Trocar par de comparação