AI BENCHY
Your ad here

AI BENCHY

Registro de alterações

Um registro simples de atualizações de produto e benchmark, agrupadas por data. Usamos isso para anotar modelos recém-testados, re-tests, mudanças no benchmark e trabalho de UX/produto já entregue.

2026-04-23

  • Novos modelos testados: inclusionai/ling-2.6-1t:free Adicionada cobertura de benchmark para InclusionAI Ling 2.6 1T Free.
  • Novo recurso: Histórico de execuções - As páginas de modelo agora mostram execuções públicas históricas e uma tabela comparativa lado a lado. (Página de modelo de exemplo)
  • UX: O leaderboard agora suporta paginação e filtros baseados em URL, além de ações diretas de comparação a partir da lista.
  • Correção de bug: A busca da homepage, as contagens de filtros e o estado da paginação agora permanecem consistentes em todo o conjunto de dados.
  • Re-test: z-ai/glm-5.1 A suíte completa de benchmark foi executada novamente e o snapshot público do histórico de execuções deste modelo foi limpo.
  • Correção de bug: Modelos que não foram realmente retestados deixaram de receber um novo timestamp tested_at.

Página de changelog criada

Este changelog começou após o lançamento, então algumas atualizações antigas não aparecem aqui.

2026-02-15

  • Lançamento inicial