2026-04-23
- Nuevos modelos probados: inclusionai/ling-2.6-1t:free Se añadió cobertura de benchmark para InclusionAI Ling 2.6 1T Free.
- Nueva función: Historial de ejecuciones - Las páginas de modelo ahora muestran ejecuciones públicas históricas y una tabla comparativa de ejecuciones en paralelo. (Página de modelo de ejemplo)
- UX: La clasificación ahora admite paginación y filtros basados en URL, además de acciones directas de comparación desde la lista.
- Corrección de error: La búsqueda de la página principal, los conteos de filtros y el estado de la paginación ahora se mantienen coherentes en todo el conjunto de datos.
- Re-test: z-ai/glm-5.1 Se volvió a ejecutar la suite completa de benchmark y se limpió la instantánea pública del historial de ejecuciones de este modelo.
- Corrección de error: Se evitó que modelos no retestados recibieran un nuevo timestamp tested_at.