#18
Xiaomi
Lançamento: 2026-04-22
Testado em: 2026-05-08 15:28
xiaomi/mimo-v2.5-pro::medium
(medium)
(none)
Preço de entrada
$1.000 / 1M
Preço de saída
$3.000 / 1M
Testes instáveis
2
Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).
16.23s
Tempo de resposta (máx.): 84.22s
Tempo de resposta (total): 292.10s
Histórico de execuções
| Testado em | Pontuação | Confiabilidade | Testes corretos | Custo total | Comparar |
|---|---|---|---|---|---|
| 2026-05-08 15:28 Suite alterada | 8.1 | 10.0 | $0.200 | Execução atual | |
| 2026-04-22 22:54 Primeira execução registrada | 8.1 | N/D | $0.201 | Comparar |
Esta execução usou uma suite de benchmark diferente. Considere as mudanças na suite ao analisar a evolução histórica.
Gráficos
Escolha o primeiro modelo e depois clique em um segundo modelo para abrir uma página lado a lado.
Pontuação vs Custo total
Tempo de resposta (médio)
Pontuação vs Tempo de resposta (médio)
Total de tokens de saída
Pontuação vs Total de tokens de saída
Comparação rápida
MiMo-V2.5-PromediumvsGPT-5.3-CodexmediumMiMo-V2.5-PromediumvsQwen3.5 Plus 2026-02-15mediumMiMo-V2.5-PromediumvsSeed-2.0-LitemediumMiMo-V2.5-PromediumvsQwen3.5-27BmediumMiMo-V2.5-PromediumvsGemini 3 Flash PreviewmediumMiMo-V2.5-PromediumvsGemini 3.1 Pro PreviewmediumMiMo-V2.5-PromediumvsRing 2.6 1tmediumDisponível grátis
Detalhamento por categoria
| Categoria | Pontuação | Consistência | Testes corretos |
|---|---|---|---|
| Truques anti-IA | 10.0 | 10.0 | |
| Programação | 10.0 | 10.0 | |
| Combinado | 10.0 | 10.0 | |
| Análise e extração de dados | 7.3 | 5.8 | |
| Específico do domínio | 5.3 | 10.0 | |
| Inteligência geral | 5.5 | 10.0 | |
| Seguimento de instruções | 9.9 | 10.0 | |
| Resolução de quebra-cabeças | 6.7 | 7.9 | |
| Chamada de ferramentas | 10.0 | 10.0 |