2026-04-23
- Novos modelos testados: inclusionai/ling-2.6-1t:free Adicionada cobertura de benchmark para InclusionAI Ling 2.6 1T Free.
- Novo recurso: Histórico de execuções - As páginas de modelo agora mostram execuções públicas históricas e uma tabela comparativa lado a lado. (Página de modelo de exemplo)
- UX: O leaderboard agora suporta paginação e filtros baseados em URL, além de ações diretas de comparação a partir da lista.
- Correção de bug: A busca da homepage, as contagens de filtros e o estado da paginação agora permanecem consistentes em todo o conjunto de dados.
- Re-test: z-ai/glm-5.1 A suíte completa de benchmark foi executada novamente e o snapshot público do histórico de execuções deste modelo foi limpo.
- Correção de bug: Modelos que não foram realmente retestados deixaram de receber um novo timestamp tested_at.