AI BENCHY श्रेणी विफलताएँ
निर्देश पालन: समय समाप्त
निर्देश पालन
समय समाप्त
देखें कि निर्देश पालन में किन AI मॉडलों में समय समाप्त आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें। क्रमबद्ध करें: विफलता संख्या ↑.
विफलता के कारण
| रैंक | मॉडल | कंपनी | समय समाप्त संख्या | श्रेणी स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #97 | Qwen3.5-9B medium | Qwen | 1 | 6.4 | 1/2 | 17.1s |