AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY

Orodha ya mabadiliko

Kumbukumbu rahisi ya masasisho ya bidhaa na benchmark, yaliyopangwa kwa tarehe. Tunaitumia kurekodi modeli mpya zilizojaribiwa, majaribio ya kurudia, mabadiliko ya benchmark, na kazi ya UX/bidhaa iliyotolewa.

2026-04-23

  • Modeli mpya zilizojaribiwa: inclusionai/ling-2.6-1t:free Imeongezwa benchmark coverage kwa InclusionAI Ling 2.6 1T Free.
  • Kipengele kipya: Historia ya run - Kurasa za modeli sasa zinaonyesha run za umma za zamani pamoja na jedwali la kulinganisha run kwa upande mbili. (Ukurasa wa mfano wa modeli)
  • UX: Leaderboard sasa inaunga mkono pagination na filters zinazotegemea URL pamoja na hatua za compare moja kwa moja kutoka kwenye orodha ya viwango.
  • Marekebisho ya hitilafu: Utafutaji wa homepage, hesabu za filters, na hali ya pagination sasa vinaendelea kuwa thabiti katika dataset nzima.
  • Jaribio la kurudia: z-ai/glm-5.1 Benchmark suite kamili iliendeshwa tena na snapshot ya umma ya historia ya run ya modeli hii ikasafishwa.
  • Marekebisho ya hitilafu: Modeli ambazo hazikufanyiwa retest halisi sasa hazipewi tena timestamp mpya ya tested_at.

Ukurasa wa changelog umeundwa

Changelog hii ilianza baada ya uzinduzi, kwa hivyo masasisho ya zamani hayapo hapa.

2026-02-15

  • Toleo la awali