AI BENCHY বিভাগীয় ব্যর্থতা
সমন্বিত: নির্দেশনা অনুসরণ করা হয়নি
সমন্বিত
নির্দেশনা অনুসরণ করা হয়নি
দেখুন সমন্বিত এ কোন AI মডেলগুলোর নির্দেশনা অনুসরণ করা হয়নি হওয়ার সম্ভাবনা সবচেয়ে বেশি, যাতে দুর্বল দিক দ্রুত ধরা যায়। সাজান: সঠিক টেস্ট ↓.
ব্যর্থতার কারণ
| র্যাঙ্ক | মডেল | কোম্পানি | নির্দেশনা অনুসরণ করা হয়নি সংখ্যা | বিভাগ স্কোর | সঠিক টেস্ট | প্রতিক্রিয়া সময় (গড়) |
|---|---|---|---|---|---|---|
| #81 | MiMo-V2.5-Pro none | Xiaomi | 1 | 3.0 | 0/1 | 3.54s |