Navegação
AI BENCHY
Your ad here

AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Xiaomi: MiMo-V2-Pro

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-04-29

Métrica DeepSeek V4 Flash DeepSeek V4 Flash high Lançamento: 2026-04-24 MiMo-V2-Pro MiMo-V2-Pro medium Lançamento: 2026-03-18
Pontuação 7.8 8.1
Posição #41 #31
Confiabilidade 10.0 N/D
Consistência 7.8 8.6
Testes corretos
Taxa de acerto por tentativa 79.6% 77.8%
Testes instáveis 5 3
Execuções totais 54 48
Custo por resultado 0.277 1.320
Custo total $0.031 $0.159
Preço de entrada $0.140 / 1M $1.000 / 1M
Preço de saída $0.280 / 1M $3.000 / 1M
Tokens de saída 1,765 2,360
Tokens de raciocínio 90,299 38,320
Tempo de resposta (médio) 45.41s 12.27s
Tempo de resposta (máx.) 218.13s 64.71s
Tempo de resposta (total) 817.30s 208.56s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 140 7,770
MiMo-V2-Pro 10.0 10.0 100.0% 0 3.06s 223 1,107
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Flash 10.0 10.0 100.0% 0 62.48s 369 9,361
MiMo-V2-Pro 10.0 10.0 100.0% 0 52.12s 485 11,361
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 465 7,347
MiMo-V2-Pro 4.7 1.6 66.7% 1 64.71s 380 14,186
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 201 1,179
MiMo-V2-Pro 7.3 5.8 83.3% 1 17.20s 260 7,484
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Flash 4.1 4.4 44.5% 2 100.31s 27 59,249
MiMo-V2-Pro 5.3 10.0 33.3% 0 6.00s 155 1,048
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 79 632
MiMo-V2-Pro 10.0 10.0 100.0% 0 4.06s 198 424
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 63 1,622
MiMo-V2-Pro 9.9 10.0 100.0% 0 3.36s 83 667
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Flash 6.4 4.5 77.8% 2 25.53s 193 2,597
MiMo-V2-Pro 7.0 7.2 55.6% 1 4.71s 313 1,179
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 228 542
MiMo-V2-Pro 10.0 10.0 100.0% 0 8.19s 263 864

Comparação rápida

Trocar par de comparação