AI BENCHY
Your ad here

AI BENCHY

Jurnal de modificări

Un jurnal simplu al actualizărilor de produs și benchmark, grupat după dată. Îl folosim pentru a nota modelele nou testate, retestările, schimbările de benchmark și lucrările UX/produs lansate.

2026-04-23

  • Modele nou testate: inclusionai/ling-2.6-1t:free Am adăugat acoperire de benchmark pentru InclusionAI Ling 2.6 1T Free.
  • Funcționalitate nouă: Istoric rulări - Paginile modelelor afișează acum rulările publice istorice și un tabel de comparație între două rulări. (Pagină exemplu model)
  • UX: Clasamentul acceptă acum paginare și filtre bazate pe URL, plus acțiuni directe de comparare din lista de ranking.
  • Remediere de bug: Căutarea de pe homepage, numărul filtrelor și starea paginării rămân acum consecvente pentru întregul set de date.
  • Retestare: z-ai/glm-5.1 Am rulat din nou suita completă de benchmark și am curățat snapshot-ul public de istoric al rulărilor pentru acest model.
  • Remediere de bug: Am împiedicat modelele fără retestare reală să primească un nou timestamp tested_at.

Pagină de jurnal creată

Acest changelog a început după lansare, așa că unele actualizări mai vechi lipsesc de aici.

2026-02-15

  • Lansare inițială