AI BENCHY Compare
MoonshotAI: Kimi K2.5 vs Owl Alpha
Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-22
| Métrica | Kimi K2.5 Kimi K2.5 none | Owl Alpha Owl Alpha none |
|---|---|---|
| Pontuação | 5.3 | 5.7 |
| Posição | #126 | #106 |
| Confiabilidade | 10.0 | 10.0 |
| Consistência | 8.9 | 9.2 |
| Testes corretos | ||
| Taxa de acerto por tentativa | 36.7% | 41.7% |
| Testes instáveis | 3 | 2 |
| Execuções totais | 60 | 60 |
| Custo por resultado | 0.428 | 0.000 |
| Custo total | $0.026 | $0.000 |
| Preço de entrada | $0.400 / 1M | $0.000 / 1M |
| Preço de saída | $1.900 / 1M | $0.000 / 1M |
| Tokens de saída | 6,734 | 4,864 |
| Tokens de raciocínio | 0 | 0 |
| Tempo de resposta (médio) | 14.16s | 8.84s |
| Tempo de resposta (máx.) | 42.13s | 47.10s |
| Tempo de resposta (total) | 184.10s | 176.83s |
Pontuação vs custo total
Tempo de resposta (médio)
Pontuação vs Tempo de resposta (médio)
Total de tokens de saída
Pontuação vs Total de tokens de saída
Detalhamento por categoria
Comparação rápida
Trocar par de comparação
CobuddymediumDisponível grátisvsOwl AlphanoneKimi K2.5nonevsElephant AlphamediumMistral Small 4mediumvsKimi K2.5noneMiniMax M2.5mediumDisponível grátisvsKimi K2.5nonegpt-oss-120bmediumDisponível grátisvsOwl AlphanoneNemotron 3 SupermediumDisponível grátisvsOwl AlphanoneMiniMax M2.7mediumvsKimi K2.5noneKimi K2.5nonevsgpt-oss-120bmediumDisponível grátisMiniMax M2.5mediumDisponível grátisvsOwl AlphanoneMistral Small 4mediumvsOwl AlphanoneGPT-5 NanomediumvsOwl AlphanoneCobuddymediumDisponível grátisvsKimi K2.5none