AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY

Änderungsprotokoll

Ein einfaches Protokoll für Produkt- und Benchmark-Updates, nach Datum gruppiert. Wir erfassen hier neu getestete Modelle, Re-Tests, Benchmark-Änderungen und ausgelieferte UX-/Produktarbeit.

2026-04-23

  • Neu getestete Modelle: inclusionai/ling-2.6-1t:free Benchmark-Abdeckung für InclusionAI Ling 2.6 1T Free hinzugefügt.
  • Neues Feature: Laufhistorie - Modellseiten zeigen jetzt historische öffentliche Läufe und eine nebeneinanderstehende Laufvergleichstabelle. (Beispiel-Modellseite)
  • UX: Das Leaderboard unterstützt jetzt URL-basierte Paginierung, Filter und direkte Vergleichsaktionen aus der Rangliste.
  • Fehlerbehebung: Suche auf der Startseite, Filteranzahl und Paginierungsstatus bleiben nun über den gesamten Datensatz konsistent.
  • Re-Test: z-ai/glm-5.1 Die vollständige Benchmark-Suite wurde erneut ausgeführt und der öffentliche Snapshot der Laufhistorie dieses Modells wurde bereinigt.
  • Fehlerbehebung: Modelle ohne tatsächlichen Retest erhalten keinen neuen tested_at-Zeitstempel mehr.

Changelog-Seite erstellt

Dieses Changelog begann erst nach dem Launch, daher fehlen hier einige ältere Updates.

2026-02-15

  • Erstveröffentlichung