AI BENCHY
موازنہ کریں چارٹس طریقہ کار
❤️ Made by XCS
Your ad here

AI BENCHY زمرہ ناکامیاں

مشترکہ
غیر معتبر ٹول کال

دیکھیں کہ مشترکہ میں کن AI ماڈلز کو غیر معتبر ٹول کال پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ناکامیوں کی تعداد ↑.

دکھائے گئے ماڈلز

4

کل ناکامیاں

4

سب سے زیادہ متاثر ماڈل

DeepSeek V3.2 1

متعلقہ زمرے

غیر معتبر ٹول کال کی تعداد کے لحاظ سے سرفہرست ماڈلز

غیر معتبر ٹول کال کی تعداد بمقابلہ اوسط اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز