AI BENCHY श्रेणी विफलताएँ
टूल कॉलिंग: कोई उत्तर नहीं
टूल कॉलिंग
कोई उत्तर नहीं
देखें कि टूल कॉलिंग में किन AI मॉडलों में कोई उत्तर नहीं आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें। क्रमबद्ध करें: सही परीक्षण ↑.
| रैंक | मॉडल | कंपनी | कोई उत्तर नहीं संख्या | श्रेणी स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #40 | GPT-5.2 medium | OpenAI | 1 | 4.7 | 0/1 | 10.3s |
| #52 | Grok 4.1 Fast medium | X AI | 1 | 2.8 | 0/1 | 27.7s |