AI BENCHY
Your ad here

AI BENCHY श्रेणी विफलताएँ

निर्देश पालन: अतिरिक्त फॉर्मेटिंग

निर्देश पालन
अतिरिक्त फॉर्मेटिंग

देखें कि निर्देश पालन में किन AI मॉडलों में अतिरिक्त फॉर्मेटिंग आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें। क्रमबद्ध करें: सही परीक्षण ↑.

दिखाए गए मॉडल

2

कुल विफलताएँ

2

सबसे अधिक प्रभावित मॉडल

DeepSeek V4 Flash 1

अतिरिक्त फॉर्मेटिंग संख्या के अनुसार शीर्ष मॉडल

अतिरिक्त फॉर्मेटिंग संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल

अनुमानित व्यर्थ लागत के अनुसार शीर्ष मॉडल