AI BENCHY زمرہ ناکامیاں
مشترکہ
کوئی جواب نہیں
مشترکہ
کوئی جواب نہیں
دیکھیں کہ مشترکہ میں کن AI ماڈلز کو کوئی جواب نہیں پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.
متعلقہ ناکامی کی وجوہات
| درجہ | ماڈل | کمپنی | کوئی جواب نہیں کی تعداد | زمرہ اسکور | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|
| #35 | Qwen3.5-35B-A3B medium | Qwen | 1 | 10.0 | 0/1 | 75.3s |