AI BENCHY
Your ad here

AI BENCHY زمرہ ناکامیاں

مشترکہ: ہدایات پر عمل نہیں کیا

مشترکہ
ہدایات پر عمل نہیں کیا

دیکھیں کہ مشترکہ میں کن AI ماڈلز کو ہدایات پر عمل نہیں کیا پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.

دکھائے گئے ماڈلز

1

کل ناکامیاں

1

سب سے زیادہ متاثر ماڈل

MiMo-V2.5-Pro 1

ہدایات پر عمل نہیں کیا کی تعداد کے لحاظ سے سرفہرست ماڈلز

ہدایات پر عمل نہیں کیا کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز