Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Qwen: Qwen3 Coder Next

Resumo

Comparação benchmark DeepSeek V4 Pro vs Qwen3 Coder Next: DeepSeek V4 Pro lidera na pontuação média com 5.7 vs 4.6. Qwen3 Coder Next tem menor custo de benchmark com $0.008 vs $0.025. Qwen3 Coder Next é mais rápido com 8.58s vs 12.38s, com taxas de acerto de 42.9% vs 28.6%.

Modelo recomendado: Qwen3 Coder Next - Oferece o melhor compromisso geral: pontuação competitiva (4.6), custo menor que DeepSeek V4 Pro e tempo de resposta equilibrado.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-04

Métrica DeepSeek V4 Pro DeepSeek V4 Pro none Lançamento: 2026-04-24 Qwen3 Coder Next Qwen3 Coder Next medium Lançamento: 2026-02-03
Pontuação 5.7 4.6
Posição #113 #150
Confiabilidade 8.5 10.0
Consistência 8.5 8.9
Testes corretos
Taxa de acerto por tentativa 42.9% 28.6%
Testes instáveis 4 3
Execuções totais 63 63
Custo por resultado 0.660 0.201
Custo total $0.025 $0.008
Preço de entrada $0.435 / 1M $0.110 / 1M
Preço de saída $0.870 / 1M $0.800 / 1M
Total de tokens de entrada 44,845 47,250
Tokens de saída 5,349 3,319
Tokens de raciocínio 0 0
Tempo de resposta (médio) 12.38s 8.58s
Tempo de resposta (máx.) 58.65s 81.80s
Tempo de resposta (total) 260.06s 128.68s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#113 DeepSeek V4 Pro

none
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

#150 Qwen3 Coder Next

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 3.5 8.0 16.7% 1 14.02s 540 704 0
Qwen3 Coder Next 3.5 8.1 16.7% 1 8.64s 645 1,252 0
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 4.6 7.9 22.2% 1 6.11s 7,279 531 0
Qwen3 Coder Next 3.7 7.2 22.2% 1 924ms 7,185 336 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 9.5 10.0 100.0% 0 25.49s 20,773 1,911 0
Qwen3 Coder Next 3.0 10.0 0.0% 0 4.28s 20,469 317 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 6.9 5.8 66.7% 1 30.54s 5,633 170 0
Qwen3 Coder Next 6.5 10.0 50.0% 0 81.80s 7,758 246 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 5.3 10.0 33.3% 0 3.17s 666 18 0
Qwen3 Coder Next 5.3 10.0 33.3% 0 638ms 753 25 0
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 4.3 9.9 0.0% 0 3.75s 471 132 0
Qwen3 Coder Next 6.3 3.4 66.7% 1 1.39s 498 142 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 6.3 10.0 50.0% 0 8.23s 627 64 0
Qwen3 Coder Next 6.3 10.0 50.0% 0 7.49s 684 63 0
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 7.6 7.2 77.8% 1 15.95s 594 173 0
Qwen3 Coder Next 3.0 10.0 0.0% 0 1.25s 678 671 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 10.0 10.0 100.0% 0 5.92s 8,079 219 0
Qwen3 Coder Next 10.0 10.0 100.0% 0 2.64s 8,364 255 0
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 3.0 10.0 0.0% 0 15.59s 183 1,427 0
Qwen3 Coder Next 3.0 10.0 0.0% 0 399ms 216 12 0

Comparação rápida

Trocar par de comparação