Navegação
AI BENCHY
Your ad here

AI BENCHY Compare

Qwen: Qwen3.6 Max Preview vs Xiaomi: MiMo-V2-Pro

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-01

Métrica Qwen3.6 Max Preview Qwen3.6 Max Preview none Lançamento: 2026-04-20 MiMo-V2-Pro MiMo-V2-Pro medium Lançamento: 2026-03-18
Pontuação 7.5 8.1
Posição #52 #33
Confiabilidade 10.0 N/D
Consistência 9.1 8.6
Testes corretos
Taxa de acerto por tentativa 68.5% 77.8%
Testes instáveis 2 3
Execuções totais 54 48
Custo por resultado 0.752 1.320
Custo total $0.083 $0.159
Preço de entrada $1.040 / 1M $1.000 / 1M
Preço de saída $6.240 / 1M $3.000 / 1M
Tokens de saída 4,732 2,360
Tokens de raciocínio 0 38,320
Tempo de resposta (médio) 3.38s 12.27s
Tempo de resposta (máx.) 20.51s 64.71s
Tempo de resposta (total) 60.83s 208.56s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 513 0
MiMo-V2-Pro 10.0 10.0 100.0% 0 3.06s 223 1,107
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Qwen3.6 Max Preview 5.0 2.0 66.7% 1 3.45s 426 0
MiMo-V2-Pro 10.0 10.0 100.0% 0 52.12s 485 11,361
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 2,842 0
MiMo-V2-Pro 4.7 1.6 66.7% 1 64.71s 380 14,186
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 243 0
MiMo-V2-Pro 7.3 5.8 83.3% 1 17.20s 260 7,484
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 18 0
MiMo-V2-Pro 5.3 10.0 33.3% 0 6.00s 155 1,048
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 76 0
MiMo-V2-Pro 10.0 10.0 100.0% 0 4.06s 198 424
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Qwen3.6 Max Preview 9.8 10.0 100.0% 0 1.45s 69 0
MiMo-V2-Pro 9.9 10.0 100.0% 0 3.36s 83 667
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.38s 323 0
MiMo-V2-Pro 7.0 7.2 55.6% 1 4.71s 313 1,179
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 222 0
MiMo-V2-Pro 10.0 10.0 100.0% 0 8.19s 263 864

Comparação rápida

Trocar par de comparação