AI BENCHY زمرہ ناکامیاں
مشترکہ: کوئی جواب نہیں
مشترکہ
کوئی جواب نہیں
دیکھیں کہ مشترکہ میں کن AI ماڈلز کو کوئی جواب نہیں پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔
ناکامی کی وجوہات
| درجہ | ماڈل | کمپنی | کوئی جواب نہیں کی تعداد | زمرہ اسکور | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|
| #43 | Qwen3.5-35B-A3B medium | Qwen | 1 | 4.7 | 0/1 | 75.3s |