Navegação
AI BENCHY
Comparar Gráficos
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3 Coder Next

Comparar:

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-05

Métrica OpenAI: GPT-5.4 none Lançamento: 2026-03-05 Qwen: Qwen3 Coder Next medium Lançamento: 2026-02-03
Posição #44 #51
Pontuação média 46 33
Consistência 89 95
Custo por resultado 1.496 0.224
Custo total $0.090 $0.007
Tempo de resposta (médio) 1.46s 13.77s
Tempo de resposta (máx.) 2.89s 81.80s
Tempo de resposta (total) 21.86s 123.93s
Testes corretos
Taxa de acerto por tentativa 44.4% 24.4%
Testes instáveis 2 1
Tokens de saída 1,635 2,793
Tokens de raciocínio 0 0

Melhores modelos por pontuação

Tempo de resposta (médio)

Pontuação vs custo total

Pontuação média vs Tempo de resposta (médio)

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
OpenAI: GPT-5.4 100 73 11.1% 1 1.41s 388 0
Qwen: Qwen3 Coder Next 13 75 22.2% 1 15.28s 1,246 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
OpenAI: GPT-5.4 100 100 0.0% 0 2.89s 291 0
Qwen: Qwen3 Coder Next 100 100 0.0% 0 4.28s 317 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
OpenAI: GPT-5.4 99 100 100.0% 0 1.04s 222 0
Qwen: Qwen3 Coder Next 54 100 50.0% 0 81.80s 246 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
OpenAI: GPT-5.4 40 72 44.4% 1 1.07s 50 0
Qwen: Qwen3 Coder Next 40 100 33.3% 0 638ms 25 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
OpenAI: GPT-5.4 55 100 50.0% 0 1.07s 81 0
Qwen: Qwen3 Coder Next 45 100 0.0% 0 7.34s 63 0
Puzzle Solving Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
OpenAI: GPT-5.4 40 98 33.3% 0 1.52s 357 0
Qwen: Qwen3 Coder Next 100 100 0.0% 0 2.30s 641 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
OpenAI: GPT-5.4 100 100 100.0% 0 2.75s 246 0
Qwen: Qwen3 Coder Next 100 100 100.0% 0 2.64s 255 0

Comparação rápida

Trocar par de comparação