AI BENCHY
Your ad here

AI BENCHY

Registro de cambios

Un registro simple de actualizaciones de producto y benchmark, agrupado por fecha. Lo usamos para anotar modelos recién probados, re-tests, cambios del benchmark y trabajo de UX/producto ya publicado.

2026-04-23

  • Nuevos modelos probados: inclusionai/ling-2.6-1t:free Se añadió cobertura de benchmark para InclusionAI Ling 2.6 1T Free.
  • Nueva función: Historial de ejecuciones - Las páginas de modelo ahora muestran ejecuciones públicas históricas y una tabla comparativa de ejecuciones en paralelo. (Página de modelo de ejemplo)
  • UX: La clasificación ahora admite paginación y filtros basados en URL, además de acciones directas de comparación desde la lista.
  • Corrección de error: La búsqueda de la página principal, los conteos de filtros y el estado de la paginación ahora se mantienen coherentes en todo el conjunto de datos.
  • Re-test: z-ai/glm-5.1 Se volvió a ejecutar la suite completa de benchmark y se limpió la instantánea pública del historial de ejecuciones de este modelo.
  • Corrección de error: Se evitó que modelos no retestados recibieran un nuevo timestamp tested_at.

Página de changelog creada

Este changelog empezó después del lanzamiento, así que faltan algunas actualizaciones anteriores.

2026-02-15

  • Lanzamiento inicial