Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Cobuddy vs Qwen: Qwen3.5-9B

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-22

Métrica Cobuddy Cobuddy medium Lançamento: 2026-05-06 Disponível grátis Qwen3.5-9B Qwen3.5-9B none Lançamento: 2026-03-02
Pontuação 5.7 4.6
Posição #105 #142
Confiabilidade 9.9 10.0
Consistência 7.0 9.7
Testes corretos
Taxa de acerto por tentativa 51.7% 21.7%
Testes instáveis 7 1
Execuções totais 60 60
Custo por resultado 0.000 0.120
Custo total $0.000 $0.005
Preço de entrada $0.000 / 1M $0.040 / 1M
Preço de saída $0.000 / 1M $0.150 / 1M
Tokens de saída 1,663 3,984
Tokens de raciocínio 116,522 0
Tempo de resposta (médio) 39.91s 1.69s
Tempo de resposta (máx.) 309.02s 5.91s
Tempo de resposta (total) 798.21s 33.84s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 8.7 7.9 91.7% 1 10.00s 98 4,666
Qwen3.5-9B 3.1 9.9 0.0% 0 1.71s 582 0
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 4.1 5.1 33.3% 1 79.17s 358 30,138
Qwen3.5-9B 4.4 6.7 16.7% 1 5.39s 1,033 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 3.0 10.0 0.0% 0 47.38s 465 7,265
Qwen3.5-9B 3.0 10.0 0.0% 0 5.91s 1,255 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 6.3 5.8 66.7% 1 17.36s 275 5,591
Qwen3.5-9B 10.0 10.0 100.0% 0 847ms 249 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 2.9 4.4 22.2% 2 128.15s 10 49,454
Qwen3.5-9B 3.0 10.0 0.0% 0 464ms 24 0
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 4.2 9.9 0.0% 0 23.23s 76 3,782
Qwen3.5-9B 4.4 9.9 0.0% 0 552ms 99 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 9.8 10.0 100.0% 0 11.60s 64 2,842
Qwen3.5-9B 6.5 10.0 50.0% 0 514ms 75 0
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 3.5 4.4 33.3% 2 12.91s 175 5,627
Qwen3.5-9B 3.1 10.0 0.0% 0 683ms 388 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 10.0 10.0 100.0% 0 11.19s 133 294
Qwen3.5-9B 10.0 10.0 100.0% 0 1.27s 273 0
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Cobuddy 3.0 10.0 0.0% 0 36.98s 9 6,863
Qwen3.5-9B 3.0 10.0 0.0% 0 2.32s 6 0

Comparação rápida

Trocar par de comparação