AI BENCHY زمرہ ناکامیاں
عمومی ذہانت: ٹائم آؤٹ
عمومی ذہانت
ٹائم آؤٹ
دیکھیں کہ عمومی ذہانت میں کن AI ماڈلز کو ٹائم آؤٹ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: درست ٹیسٹس ↓.
ناکامی کی وجوہات
| درجہ | ماڈل | کمپنی | ٹائم آؤٹ کی تعداد | زمرہ اسکور | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|
| #8 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 1 | 4.7 | 0/1 | 79.9s |
| #19 | Qwen3.5-122B-A10B medium | Qwen | 1 | 3.4 | 0/1 | 34.1s |
| #43 | Qwen3.5-35B-A3B medium | Qwen | 1 | 2.8 | 0/1 | 30.3s |
| #97 | Qwen3.5-9B medium | Qwen | 1 | 2.8 | 0/1 | 226.4s |