Navegação
AI BENCHY
Comparar Gráficos Metodologia
❤️ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs Qwen: Qwen3.5-Flash

Comparar:

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-06

Métrica OpenAI: GPT-5.2 Chat none Lançamento: 2025-12-11 Qwen: Qwen3.5-Flash medium Lançamento: 2026-02-24
Posição #15 #24
Pontuação média 7.4 6.9
Consistência 9.1 7.5
Custo por resultado 2.440 0.720
Custo total $0.269 $0.072
Testes corretos
Taxa de acerto por tentativa 75.0% 81.3%
Testes instáveis 2 5
common.totalRuns 48 (16 x 3) 48 (16 x 3)
Tokens de saída 15,845 1,807
Tokens de raciocínio 0 169,952
Tempo de resposta (médio) 7.03s 70.81s
Tempo de resposta (máx.) 38.52s 234.29s
Tempo de resposta (total) 112.51s 1132.90s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação média vs Tempo de resposta (médio)

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
OpenAI: GPT-5.2 Chat 10.0 10.0 100.0% 0 3.97s 1,651 0
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 71.35s 363 23,645
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
OpenAI: GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 483 8,270
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
OpenAI: GPT-5.2 Chat 9.9 10.0 100.0% 0 3.05s 980 0
Qwen: Qwen3.5-Flash 5.5 5.9 83.3% 1 56.99s 235 16,237
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
OpenAI: GPT-5.2 Chat 4.0 10.0 33.3% 0 17.78s 7,810 0
Qwen: Qwen3.5-Flash 4.0 7.2 44.4% 1 146.50s 58 43,615
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
OpenAI: GPT-5.2 Chat 4.0 3.0 33.3% 1 3.20s 335 0
Qwen: Qwen3.5-Flash 5.0 3.1 66.7% 1 40.05s 99 38,486
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
OpenAI: GPT-5.2 Chat 6.0 6.1 83.3% 1 5.46s 1,528 0
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 98 14,139
Puzzle Solving Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
OpenAI: GPT-5.2 Chat 7.0 10.0 66.7% 0 4.42s 1,743 0
Qwen: Qwen3.5-Flash 4.0 4.4 77.8% 2 56.74s 162 24,276
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
OpenAI: GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 309 1,284

Comparação rápida

Trocar par de comparação