AI BENCHY श्रेणी विफलताएँ
निर्देश पालन: API त्रुटि
निर्देश पालन
API त्रुटि
देखें कि निर्देश पालन में किन AI मॉडलों में API त्रुटि आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें। क्रमबद्ध करें: सही परीक्षण ↓.
विफलता के कारण
| रैंक | मॉडल | कंपनी | API त्रुटि संख्या | श्रेणी स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #93 | Qwen3.6 Plus Preview medium | Qwen | 1 | 6.5 | 1/2 | 3.40s |