AI BENCHY
Your ad here

AI BENCHY श्रेणी अपयशे

कोडिंग: सूचनांचे पालन केले नाही

कोडिंग
सूचनांचे पालन केले नाही

कोडिंग मध्ये कोणत्या AI मॉडेल्सना सूचनांचे पालन केले नाही येण्याची शक्यता जास्त आहे ते पाहा, म्हणजे कमकुवत बाजू लवकर ओळखता येतील. क्रम लावा: बरोबर चाचण्या ↓.

दाखवलेली मॉडेल्स

2

एकूण अपयशे

2

सर्वाधिक प्रभावित मॉडेल

Grok 4.1 Fast 1

सूचनांचे पालन केले नाही संख्या नुसार शीर्ष मॉडेल्स

सूचनांचे पालन केले नाही संख्या वि स्कोअर

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स

अंदाजित वाया गेलेला खर्च नुसार शीर्ष मॉडेल्स