AI BENCHY
Your ad here

AI BENCHY

تبدیلی لاگ

مصنوعہ اور بینچ مارک اپڈیٹس کا ایک سادہ لاگ، تاریخ کے مطابق گروپ کیا گیا۔ ہم اسے نئے ٹیسٹ کیے گئے ماڈلز، دوبارہ ٹیسٹ، بینچ مارک تبدیلیوں، اور جاری کی گئی UX/پروڈکٹ اپڈیٹس کو نوٹ کرنے کے لیے استعمال کرتے ہیں۔

2026-04-23

  • نئے ٹیسٹ کیے گئے ماڈلز: inclusionai/ling-2.6-1t:free InclusionAI Ling 2.6 1T Free کے لیے benchmark coverage شامل کی گئی۔
  • نئی خصوصیت: رن ہسٹری - ماڈل صفحات اب تاریخی public runs اور side-by-side run comparison جدول دکھاتے ہیں۔ (مثالی ماڈل صفحہ)
  • UX: لیڈر بورڈ اب URL-based pagination، filters اور ranking list سے direct compare actions کو support کرتا ہے۔
  • بگ فکس: ہوم پیج search، filter counts اور pagination state اب پورے dataset میں ایک جیسی رہتی ہے۔
  • دوبارہ ٹیسٹ: z-ai/glm-5.1 اس ماڈل کے لیے مکمل benchmark suite دوبارہ چلائی گئی اور public run-history snapshot صاف کیا گیا۔
  • بگ فکس: جن ماڈلز کا حقیقت میں retest نہیں ہوا، انہیں نیا tested_at timestamp ملنا بند کر دیا گیا۔

چینج لاگ صفحہ بنایا گیا

یہ چینج لاگ لانچ کے بعد شروع ہوا، اس لیے کچھ پرانی اپڈیٹس یہاں موجود نہیں ہیں۔

2026-02-15

  • ابتدائی ریلیز