टूल कॉलिंग x कोई उत्तर नहीं रैंकिंग

देखें कि टूल कॉलिंग में किन AI मॉडलों में कोई उत्तर नहीं आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें। क्रमबद्ध करें: सही परीक्षण ↑.

दिखाए गए मॉडल

कुल विफलताएँ

सबसे अधिक प्रभावित मॉडल

GPT-5.2 1

विफलता के कारण

API त्रुटि17 अमान्य टूल कॉल9 निर्देशों का पालन नहीं किया8 गलत उत्तर3 कोई उत्तर नहीं2

श्रेणियाँ

संयुक्त29 कोडिंग18 सामान्य ज्ञान13 डेटा पार्सिंग और निष्कर्षण8 डोमेन-विशिष्ट8 एंटी-एआई ट्रिक्स4 पहेली समाधान3 टूल कॉलिंग2 निर्देश पालन2

2/2

रैंक	मॉडल	कंपनी	कोई उत्तर नहीं संख्या	श्रेणी स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#21	GPT-5.2 medium	OpenAI	1	4.7	$0.951	0/1	10.3s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.951 प्रतिक्रिया समय (औसत) 10.3s
#185	Grok 4.1 Fast medium	X AI	1	2.8	$0.069	0/1	27.7s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.069 प्रतिक्रिया समय (औसत) 27.7s

मॉडल फ़िल्टर करें

कोई उत्तर नहीं संख्या के अनुसार शीर्ष मॉडल

कोई उत्तर नहीं संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल

अनुमानित व्यर्थ लागत के अनुसार शीर्ष मॉडल

टूल कॉलिंग: कोई उत्तर नहीं

मॉडल फ़िल्टर करें

कोई उत्तर नहीं संख्या के अनुसार शीर्ष मॉडल

कोई उत्तर नहीं संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल

अनुमानित व्यर्थ लागत के अनुसार शीर्ष मॉडल