AI BENCHY
Advertise here

AI BENCHY श्रेणी विफलताएँ

निर्देश पालन: कोई उत्तर नहीं

निर्देश पालन
कोई उत्तर नहीं

देखें कि निर्देश पालन में किन AI मॉडलों में कोई उत्तर नहीं आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें।

दिखाए गए मॉडल

2

कुल विफलताएँ

2

सबसे अधिक प्रभावित मॉडल

Gemini 3.1 Flash Lite 1

कोई उत्तर नहीं संख्या के अनुसार शीर्ष मॉडल

कोई उत्तर नहीं संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल

अनुमानित व्यर्थ लागत के अनुसार शीर्ष मॉडल