Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Modelos comparados

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-04-26

Métrica MiMo-V2.5 MiMo-V2.5 medium Lançamento: 2026-04-22 MiMo-V2.5-Pro MiMo-V2.5-Pro medium Lançamento: 2026-04-22 MiMo-V2-Omni MiMo-V2-Omni medium Lançamento: 2026-03-18 MiMo-V2-Pro MiMo-V2-Pro medium Lançamento: 2026-03-18
Pontuação 7.8 8.1 7.7 8.1
Posição #41 #27 #43 #28
Confiabilidade N/D N/D N/D N/D
Consistência 8.6 8.8 9.9 8.6
Testes corretos
Taxa de acerto por tentativa 74.1% 75.9% 61.1% 77.8%
Testes instáveis 3 3 0 3
Execuções totais 54 54 20 48
Custo por resultado 2.102 1.674 1.383 1.320
Custo total $0.253 $0.201 $0.153 $0.159
Preço de entrada $0.400 / 1M $1.000 / 1M $0.400 / 1M $1.000 / 1M
Preço de saída $2.000 / 1M $3.000 / 1M $2.000 / 1M $3.000 / 1M
Tokens de saída 2,840 2,735 928 2,360
Tokens de raciocínio 116,242 52,571 72,661 38,320
Tempo de resposta (médio) 13.71s 16.17s 16.76s 12.27s
Tempo de resposta (máx.) 86.93s 84.22s 158.78s 64.71s
Tempo de resposta (total) 246.73s 291.09s 301.61s 208.56s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
MiMo-V2.5 10.0 10.0 100.0% 0 1.98s 303 2,022
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 2.95s 273 1,363
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.11s 112 402
MiMo-V2-Pro 10.0 10.0 100.0% 0 3.06s 223 1,107
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
MiMo-V2.5 10.0 10.0 100.0% 0 31.48s 488 14,813
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 32.58s 543 7,485
MiMo-V2-Omni 4.0 7.9 0.0% 0 68.55s 265 33,660
MiMo-V2-Pro 10.0 10.0 100.0% 0 52.12s 485 11,361
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 348 11,870
MiMo-V2-Omni 10.0 10.0 100.0% 0 19.29s 131 2,807
MiMo-V2-Pro 4.7 1.6 66.7% 1 64.71s 380 14,186
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 260 8,383
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.29s 87 323
MiMo-V2-Pro 7.3 5.8 83.3% 1 17.20s 260 7,484
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 275 17,023
MiMo-V2-Omni 3.0 10.0 0.0% 0 55.12s 13 33,279
MiMo-V2-Pro 5.3 10.0 33.3% 0 6.00s 155 1,048
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
MiMo-V2.5 3.8 2.5 33.3% 1 1.55s 118 170
MiMo-V2.5-Pro 5.1 3.3 33.3% 1 4.27s 150 549
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.86s 58 202
MiMo-V2-Pro 10.0 10.0 100.0% 0 4.06s 198 424
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 82 803
MiMo-V2-Omni 8.3 10.0 50.0% 0 4.92s 35 201
MiMo-V2-Pro 9.9 10.0 100.0% 0 3.36s 83 667
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.16s 493 2,187
MiMo-V2-Omni 6.5 10.0 33.3% 0 3.88s 126 481
MiMo-V2-Pro 7.0 7.2 55.6% 1 4.71s 313 1,179
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 311 2,908
MiMo-V2-Omni 10.0 10.0 100.0% 0 11.07s 101 1,306
MiMo-V2-Pro 10.0 10.0 100.0% 0 8.19s 263 864

Comparação rápida

Trocar par de comparação