AI BENCHY श्रेणी विफलताएँ
डोमेन-विशिष्ट: निर्देशों का पालन नहीं किया
डोमेन-विशिष्ट
निर्देशों का पालन नहीं किया
देखें कि डोमेन-विशिष्ट में किन AI मॉडलों में निर्देशों का पालन नहीं किया आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें। क्रमबद्ध करें: सही परीक्षण ↑.
विफलता के कारण
| रैंक | मॉडल | कंपनी | निर्देशों का पालन नहीं किया संख्या | श्रेणी स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #82 | Grok Build 0.1 none | X AI | 1 | 3.6 | 0/3 | 103.7s |