AI BENCHY Compare
MoonshotAI: Kimi K2.5 vs MoonshotAI: Kimi K2.6
Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-04-29
| Métrica | Kimi K2.5 Kimi K2.5 none | Kimi K2.6 Kimi K2.6 none |
|---|---|---|
| Puntuación | 5.5 | 5.8 |
| Rango | #99 | #89 |
| Fiabilidad | N/D | N/D |
| Consistencia | 8.7 | 9.1 |
| Pruebas correctas | ||
| Tasa de aciertos por intento | 40.7% | 42.6% |
| Pruebas inestables | 3 | 2 |
| Ejecuciones totales | 54 | 54 |
| Costo por resultado | 0.271 | 0.543 |
| Costo total | $0.017 | $0.038 |
| Precio de entrada | $0.440 / 1M | $0.745 / 1M |
| Precio de salida | $2.000 / 1M | $4.655 / 1M |
| Tokens de salida | 2,659 | 2,973 |
| Tokens de razonamiento | 0 | 0 |
| Tiempo de respuesta (promedio) | 13.37s | 2.05s |
| Tiempo de respuesta (máximo) | 42.13s | 6.65s |
| Tiempo de respuesta (total) | 147.05s | 36.93s |
Puntuación vs costo total
Tiempo de respuesta (promedio)
Puntuación vs Tiempo de respuesta (promedio)
Total de tokens de salida
Puntuación vs Total de tokens de salida
Desglose por categoría
Comparación rápida
Cambiar par de comparación
Kimi K2.6nonevsgpt-oss-120bmediumDisponible gratisMistral Small 4mediumvsKimi K2.5noneMiniMax M2.5mediumDisponible gratisvsKimi K2.5noneMiniMax M2.5mediumDisponible gratisvsKimi K2.6noneMistral Small 4mediumvsKimi K2.6noneMiniMax M2.7mediumvsKimi K2.5noneKimi K2.5nonevsgpt-oss-120bmediumDisponible gratisKimi K2.5nonevsElephant AlphamediumKimi K2.6nonevsLaguna Xs.2mediumDisponible gratisKimi K2.5nonevsNemotron 3 Nano Omni 30b A3b ReasoningmediumDisponible gratisKimi K2.6nonevsGPT-5 NanomediumKimi K2.6nonevsLaguna M.1mediumDisponible gratis