AI BENCHY زمرہ ناکامیاں
عمومی ذہانت: ٹائم آؤٹ
عمومی ذہانت
ٹائم آؤٹ
دیکھیں کہ عمومی ذہانت میں کن AI ماڈلز کو ٹائم آؤٹ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↑.
ناکامی کی وجوہات
| درجہ | ماڈل | کمپنی | ٹائم آؤٹ کی تعداد | زمرہ اسکور | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|
| #43 | Qwen3.5-35B-A3B medium | Qwen | 1 | 2.8 | 0/1 | 30.3s |
| #19 | Qwen3.5-122B-A10B medium | Qwen | 1 | 3.4 | 0/1 | 34.1s |
| #8 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 1 | 4.7 | 0/1 | 79.9s |
| #97 | Qwen3.5-9B medium | Qwen | 1 | 2.8 | 0/1 | 226.4s |