AI BENCHY Compare
MoonshotAI: Kimi K2.5 vs OpenAI: GPT-5.4
Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-04-16
| Métrica | Kimi K2.5 Kimi K2.5 medium | GPT-5.4 GPT-5.4 none |
|---|---|---|
| Puntuación | 7.0 | 5.9 |
| Rango | #45 | #65 |
| Consistencia | 6.8 | 9.1 |
| Pruebas correctas | ||
| Tasa de aciertos por intento | 72.2% | 42.6% |
| Pruebas inestables | 7 | 2 |
| Ejecuciones totales | 54 | 54 |
| Costo por resultado | 2.444 | 1.477 |
| Costo total | $0.220 | $0.104 |
| Precio de entrada | $0.383 / 1M | $2.500 / 1M |
| Precio de salida | $1.720 / 1M | $15.000 / 1M |
| Tokens de salida | 42,176 | 2,317 |
| Tokens de razonamiento | 84,870 | 0 |
| Tiempo de respuesta (promedio) | 72.43s | 1.51s |
| Tiempo de respuesta (máximo) | 150.77s | 2.95s |
| Tiempo de respuesta (total) | 796.70s | 27.21s |
Puntuación vs costo total
Tiempo de respuesta (promedio)
Puntuación vs Tiempo de respuesta (promedio)
Total de tokens de salida
Puntuación vs Total de tokens de salida
Desglose por categoría
Comparación rápida
Cambiar par de comparación
Gemma 4 31BnoneDisponible gratisvsKimi K2.5mediumMiniMax M2.5mediumDisponible gratisvsGPT-5.4noneKimi K2.5mediumvsQwen3.5 Plus 2026-02-15noneMistral Small 4mediumvsGPT-5.4noneKimi K2.5mediumvsGLM 5noneClaude Sonnet 4.6nonevsKimi K2.5mediumKimi K2.5mediumvsMiMo-V2-OmninoneMercury 2mediumvsGPT-5.4noneMiniMax M2.7mediumvsGPT-5.4noneGPT-5.4nonevsElephantmediumKimi K2.5mediumvsGPT-5.3 ChatnoneGPT-5.4nonevsGrok 4.1 Fastmedium