Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Cobuddy vs Qwen: Qwen3.5-122B-A10B

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-19

Métrica Cobuddy Cobuddy medium Lançamento: 2026-05-06 Disponível grátis Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Lançamento: 2026-02-24
Pontuação 5.8 5.5
Posição #102 #117
Confiabilidade 9.9 10.0
Consistência 6.9 9.2
Testes corretos
Taxa de acerto por tentativa 54.4% 36.8%
Testes instáveis 7 2
Execuções totais 57 57
Custo por resultado 0.000 0.361
Custo total $0.000 $0.022
Preço de entrada $0.000 / 1M $0.260 / 1M
Preço de saída $0.000 / 1M $2.080 / 1M
Tokens de saída 1,648 3,350
Tokens de raciocínio 96,062 0
Tempo de resposta (médio) 36.50s 3.52s
Tempo de resposta (máx.) 309.02s 46.00s
Tempo de resposta (total) 693.45s 66.80s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 8.7 7.9 91.7% 1 10.00s 98 4,666
Qwen3.5-122B-A10B 4.8 10.0 25.0% 0 1.59s 312 0
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 4.3 1.1 66.7% 1 53.59s 343 9,678
Qwen3.5-122B-A10B 4.3 1.1 66.7% 1 3.44s 659 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 3.0 10.0 0.0% 0 47.38s 465 7,265
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 46.00s 1,137 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 6.3 5.8 66.7% 1 17.36s 275 5,591
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 1.01s 243 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 2.9 4.4 22.2% 2 128.15s 10 49,454
Qwen3.5-122B-A10B 5.3 10.0 33.3% 0 465ms 15 0
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 4.2 9.9 0.0% 0 23.23s 76 3,782
Qwen3.5-122B-A10B 5.0 10.0 0.0% 0 1.12s 66 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 9.8 10.0 100.0% 0 11.60s 64 2,842
Qwen3.5-122B-A10B 6.3 10.0 50.0% 0 585ms 70 0
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 3.5 4.4 33.3% 2 12.91s 175 5,627
Qwen3.5-122B-A10B 3.7 7.7 11.1% 1 982ms 575 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 10.0 10.0 100.0% 0 11.19s 133 294
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 2.04s 264 0
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 3.0 10.0 0.0% 0 36.98s 9 6,863
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 295ms 9 0

Comparação rápida

Trocar par de comparação