AI BENCHY
Advertise here

AI BENCHY श्रेणी विफलताएँ

डोमेन-विशिष्ट: निर्देशों का पालन नहीं किया

डोमेन-विशिष्ट
निर्देशों का पालन नहीं किया

देखें कि डोमेन-विशिष्ट में किन AI मॉडलों में निर्देशों का पालन नहीं किया आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

1

कुल विफलताएँ

1

सबसे अधिक प्रभावित मॉडल

Grok Build 0.1 1

निर्देशों का पालन नहीं किया संख्या के अनुसार शीर्ष मॉडल

निर्देशों का पालन नहीं किया संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल

अनुमानित व्यर्थ लागत के अनुसार शीर्ष मॉडल