AI BENCHY श्रेणी विफलताएँ
संयुक्त: निर्देशों का पालन नहीं किया
संयुक्त
निर्देशों का पालन नहीं किया
देखें कि संयुक्त में किन AI मॉडलों में निर्देशों का पालन नहीं किया आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें। क्रमबद्ध करें: सही परीक्षण ↑.
विफलता के कारण
1/1
मॉडल फ़िल्टर करें
मौजूदा खोज और फ़िल्टर से कोई मॉडल मेल नहीं खाता।
| रैंक | मॉडल | कंपनी | निर्देशों का पालन नहीं किया संख्या | श्रेणी स्कोर | कुल लागत | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|---|
| #119 | MiMo-V2.5-Pro none | Xiaomi | 1 | 3.0 | $0.017 | 0/1 | 3.54s |