AI BENCHY
Advertise here

AI BENCHY বিভাগীয় ব্যর্থতা

অ্যান্টি-এআই কৌশল: নির্দেশনা অনুসরণ করা হয়নি

অ্যান্টি-এআই কৌশল
নির্দেশনা অনুসরণ করা হয়নি

দেখুন অ্যান্টি-এআই কৌশল এ কোন AI মডেলগুলোর নির্দেশনা অনুসরণ করা হয়নি হওয়ার সম্ভাবনা সবচেয়ে বেশি, যাতে দুর্বল দিক দ্রুত ধরা যায়। সাজান: ব্যর্থতার সংখ্যা ↑.

দেখানো মডেল

15

মোট ব্যর্থতা

30

সবচেয়ে বেশি প্রভাবিত মডেল

GPT-5 Mini 1
29/29
র‍্যাঙ্ক মডেল কোম্পানি নির্দেশনা অনুসরণ করা হয়নি সংখ্যা বিভাগ স্কোর মোট খরচ সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়)

নির্দেশনা অনুসরণ করা হয়নি সংখ্যা অনুযায়ী শীর্ষ মডেল

নির্দেশনা অনুসরণ করা হয়নি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল