AI BENCHY
Your ad here

AI BENCHY বিভাগীয় ব্যর্থতা

সমন্বিত: নির্দেশনা অনুসরণ করা হয়নি

সমন্বিত
নির্দেশনা অনুসরণ করা হয়নি

দেখুন সমন্বিত এ কোন AI মডেলগুলোর নির্দেশনা অনুসরণ করা হয়নি হওয়ার সম্ভাবনা সবচেয়ে বেশি, যাতে দুর্বল দিক দ্রুত ধরা যায়। সাজান: সঠিক টেস্ট ↓.

দেখানো মডেল

1

মোট ব্যর্থতা

1

সবচেয়ে বেশি প্রভাবিত মডেল

MiMo-V2.5-Pro 1

নির্দেশনা অনুসরণ করা হয়নি সংখ্যা অনুযায়ী শীর্ষ মডেল

নির্দেশনা অনুসরণ করা হয়নি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল