AI BENCHY श्रेणी विफलताएँ
निर्देश पालन: समय समाप्त
निर्देश पालन
समय समाप्त
देखें कि निर्देश पालन में किन AI मॉडलों में समय समाप्त आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें। क्रमबद्ध करें: सही परीक्षण ↑.
विफलता के कारण
| रैंक | मॉडल | कंपनी | समय समाप्त संख्या | श्रेणी स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #97 | Qwen3.5-9B medium | Qwen | 1 | 6.4 | 1/2 | 17.1s |