AI BENCHY Compare
MoonshotAI: Kimi K2.5 vs OpenAI: GPT-5.4
Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-04-16
| Métrica | Kimi K2.5 Kimi K2.5 medium | GPT-5.4 GPT-5.4 none |
|---|---|---|
| Pontuação | 7.0 | 5.9 |
| Posição | #45 | #65 |
| Consistência | 6.8 | 9.1 |
| Testes corretos | ||
| Taxa de acerto por tentativa | 72.2% | 42.6% |
| Testes instáveis | 7 | 2 |
| Execuções totais | 54 | 54 |
| Custo por resultado | 2.444 | 1.477 |
| Custo total | $0.220 | $0.104 |
| Preço de entrada | $0.383 / 1M | $2.500 / 1M |
| Preço de saída | $1.720 / 1M | $15.000 / 1M |
| Tokens de saída | 42,176 | 2,317 |
| Tokens de raciocínio | 84,870 | 0 |
| Tempo de resposta (médio) | 72.43s | 1.51s |
| Tempo de resposta (máx.) | 150.77s | 2.95s |
| Tempo de resposta (total) | 796.70s | 27.21s |
Pontuação vs custo total
Tempo de resposta (médio)
Pontuação vs Tempo de resposta (médio)
Total de tokens de saída
Pontuação vs Total de tokens de saída
Detalhamento por categoria
Comparação rápida
Trocar par de comparação
Gemma 4 31BnoneDisponível grátisvsKimi K2.5mediumMiniMax M2.5mediumDisponível grátisvsGPT-5.4noneKimi K2.5mediumvsQwen3.5 Plus 2026-02-15noneMistral Small 4mediumvsGPT-5.4noneKimi K2.5mediumvsGLM 5noneClaude Sonnet 4.6nonevsKimi K2.5mediumKimi K2.5mediumvsMiMo-V2-OmninoneMercury 2mediumvsGPT-5.4noneMiniMax M2.7mediumvsGPT-5.4noneGPT-5.4nonevsElephantmediumKimi K2.5mediumvsGPT-5.3 ChatnoneGPT-5.4nonevsGrok 4.1 Fastmedium