Navegação
AI BENCHY
Comparar Gráficos
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Inception: Mercury 2 vs Qwen: Qwen3 Coder Next

Comparar:

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-05

Métrica Inception: Mercury 2 medium Lançamento: 2026-02-24 Qwen: Qwen3 Coder Next none Lançamento: 2026-02-03
Posição #35 #49
Pontuação média 5.4 3.6
Testes corretos
Consistência 8.3 10.0
Custo por resultado 0.622 0.226
Custo total $0.044 $0.007
Taxa de acerto por tentativa 57.8% 20.0%
Testes instáveis 3 0
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
Tokens de saída 3,571 2,874
Tokens de raciocínio 45,379 0
Tempo de resposta (médio) 2.47s 12.82s
Tempo de resposta (máx.) 14.63s 45.14s
Tempo de resposta (total) 34.56s 115.42s

Melhores modelos por pontuação

Tempo de resposta (médio)

Pontuação vs custo total

Pontuação média vs Tempo de resposta (médio)

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Inception: Mercury 2 7.3 9.8 66.7% 0 1.30s 2,531 2,410
Qwen: Qwen3 Coder Next 2.3 10.0 0.0% 0 4.39s 1,315 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Inception: Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
Qwen: Qwen3 Coder Next 10.0 10.0 0.0% 0 45.14s 317 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Inception: Mercury 2 5.5 5.9 83.3% 1 1.11s 183 1,656
Qwen: Qwen3 Coder Next 5.4 10.0 50.0% 0 1.32s 246 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Inception: Mercury 2 10.0 7.2 11.1% 1 6.48s 41 30,754
Qwen: Qwen3 Coder Next 4.0 10.0 33.3% 0 962ms 26 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Inception: Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
Qwen: Qwen3 Coder Next 4.5 10.0 0.0% 0 7.71s 63 0
Puzzle Solving Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Inception: Mercury 2 1.7 7.5 22.2% 1 934ms 354 2,758
Qwen: Qwen3 Coder Next 1.3 10.0 0.0% 0 22.86s 652 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Inception: Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
Qwen: Qwen3 Coder Next 10.0 10.0 100.0% 0 2.47s 255 0

Comparação rápida

Trocar par de comparação