2026-04-23
- Nouveaux modèles testés: inclusionai/ling-2.6-1t:free Ajout de la couverture de benchmark pour InclusionAI Ling 2.6 1T Free.
- Nouvelle fonctionnalité: Historique des exécutions - Les pages modèle affichent désormais les exécutions publiques historiques et un tableau de comparaison côte à côte. (Page modèle exemple)
- UX: Le classement prend désormais en charge la pagination et les filtres pilotés par URL, ainsi que des actions de comparaison directe depuis la liste.
- Correction de bug: La recherche de la page d’accueil, les compteurs de filtres et l’état de la pagination restent désormais cohérents sur l’ensemble du jeu de données.
- Re-test: z-ai/glm-5.1 La suite complète de benchmark a été relancée et le snapshot public d’historique des exécutions de ce modèle a été nettoyé.
- Correction de bug: Les modèles non retestés ne reçoivent plus un nouveau timestamp tested_at.