AI BENCHY زمرہ ناکامیاں
مشترکہ: ہدایات پر عمل نہیں کیا
مشترکہ
ہدایات پر عمل نہیں کیا
دیکھیں کہ مشترکہ میں کن AI ماڈلز کو ہدایات پر عمل نہیں کیا پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔
ناکامی کی وجوہات
1/1
ماڈلز فلٹر کریں
موجودہ تلاش اور فلٹرز سے کوئی ماڈل مطابقت نہیں رکھتا۔
| درجہ | ماڈل | کمپنی | ہدایات پر عمل نہیں کیا کی تعداد | زمرہ اسکور | کل لاگت | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|---|
| #119 | MiMo-V2.5-Pro none | Xiaomi | 1 | 3.0 | $0.017 | 0/1 | 3.54s |