AI BENCHY
Your ad here

AI BENCHY श्रेणी अपयशे

टूल कॉलिंग: चुकीचे उत्तर

टूल कॉलिंग
चुकीचे उत्तर

टूल कॉलिंग मध्ये कोणत्या AI मॉडेल्सना चुकीचे उत्तर येण्याची शक्यता जास्त आहे ते पाहा, म्हणजे कमकुवत बाजू लवकर ओळखता येतील.

दाखवलेली मॉडेल्स

2

एकूण अपयशे

2

सर्वाधिक प्रभावित मॉडेल

GLM 4.7 Flash 1

चुकीचे उत्तर संख्या नुसार शीर्ष मॉडेल्स

चुकीचे उत्तर संख्या वि स्कोअर

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स

अंदाजित वाया गेलेला खर्च नुसार शीर्ष मॉडेल्स