AI BENCHY
Advertise here

AI BENCHY বিভাগীয় ব্যর্থতা

সমন্বিত: নির্দেশনা অনুসরণ করা হয়নি

সমন্বিত
নির্দেশনা অনুসরণ করা হয়নি

দেখুন সমন্বিত এ কোন AI মডেলগুলোর নির্দেশনা অনুসরণ করা হয়নি হওয়ার সম্ভাবনা সবচেয়ে বেশি, যাতে দুর্বল দিক দ্রুত ধরা যায়। সাজান: সঠিক টেস্ট ↑.

দেখানো মডেল

1

মোট ব্যর্থতা

1

সবচেয়ে বেশি প্রভাবিত মডেল

MiMo-V2.5-Pro 1
1/1
র‍্যাঙ্ক মডেল কোম্পানি নির্দেশনা অনুসরণ করা হয়নি সংখ্যা বিভাগ স্কোর মোট খরচ সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়)

নির্দেশনা অনুসরণ করা হয়নি সংখ্যা অনুযায়ী শীর্ষ মডেল

নির্দেশনা অনুসরণ করা হয়নি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল