Navegação
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.5 vs Qwen: Qwen3.7 Plus

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-03

Métrica GPT-5.5 GPT-5.5 low Lançamento: 2026-04-24 Qwen3.7 Plus Qwen3.7 Plus medium Lançamento: 2026-06-03
Pontuação 8.9 8.4
Posição #8 #16
Confiabilidade 10.0 9.9
Consistência 10.0 9.2
Testes corretos
Taxa de acerto por tentativa 85.0% 80.0%
Testes instáveis 0 2
Execuções totais 60 60
Custo por resultado 4.833 1.324
Custo total $0.822 $0.199
Preço de entrada $5.000 / 1M $0.400 / 1M
Preço de saída $30.000 / 1M $1.600 / 1M
Total de tokens de entrada 31,590 38,104
Tokens de saída 2,025 2,107
Tokens de raciocínio 20,092 112,479
Tempo de resposta (médio) 9.43s 36.84s
Tempo de resposta (máx.) 56.19s 178.04s
Tempo de resposta (total) 188.66s 736.86s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
Qwen3.7 Plus 10.0 10.0 100.0% 0 8.58s 672 195 5,065
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 14.42s 4,683 402 4,034
Qwen3.7 Plus 6.5 5.9 66.7% 1 122.40s 3,637 396 30,301
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
Qwen3.7 Plus 10.0 10.0 100.0% 0 65.24s 14,934 366 10,132
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
Qwen3.7 Plus 10.0 10.0 100.0% 0 21.75s 7,782 270 6,713
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Qwen3.7 Plus 3.6 7.2 22.2% 1 45.35s 771 57 27,073
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
Qwen3.7 Plus 10.0 10.0 100.0% 0 25.48s 516 123 3,998
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
Qwen3.7 Plus 10.0 10.0 100.0% 0 16.13s 699 102 5,013
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
Qwen3.7 Plus 10.0 10.0 100.0% 0 16.38s 696 280 7,312
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
Qwen3.7 Plus 10.0 10.0 100.0% 0 15.02s 8,193 292 1,831
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840
Qwen3.7 Plus 3.0 10.0 0.0% 0 91.07s 204 26 15,041

Comparação rápida

Trocar par de comparação