2026-05-22
- نماذج جديدة تم اختبارها: Qwen3.7 Max تمت إضافة تغطية benchmark لـ Qwen 3.7 Max.
- اختبارات جديدة أُضيفت: تمت إضافة فئة اختبار Coding جديدة تركز على اكتشاف الأخطاء في حلول C++.
AI BENCHY
سجل بسيط لتحديثات المنتج والاختبارات، مجمعة حسب التاريخ. نستخدمه لتوثيق النماذج المختبرة حديثًا، وإعادات الاختبار، وتغييرات الاختبارات، والعمل المنتجّي وتجارب الاستخدام التي تم إطلاقها.
تم إنشاء صفحة سجل التغييرات
بدأ هذا السجل بعد الإطلاق، لذلك بعض التحديثات الأقدم غير موجودة هنا.