AI BENCHY زمرہ ناکامیاں
ڈومین مخصوص: API خرابی
ڈومین مخصوص
API خرابی
دیکھیں کہ ڈومین مخصوص میں کن AI ماڈلز کو API خرابی پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↑.
ناکامی کی وجوہات
| درجہ | ماڈل | کمپنی | API خرابی کی تعداد | زمرہ اسکور | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|
| #160 | LFM2-24B-A2B none | Liquid | 1 | 5.9 | 1/3 | 287ms |
| #133 | DeepSeek V3.2 none | DeepSeek | 1 | 2.9 | 0/3 | 4.17s |
| #132 | Mistral Small 4 medium | Mistral | 1 | 5.3 | 1/3 | 6.11s |
| #156 | Hy3 preview none | Tencent | 1 | 3.6 | 0/3 | 17.6s |
| #93 | Qwen3.6 Plus Preview medium | Qwen | 1 | 3.0 | 0/3 | 22.1s |
| #103 | DeepSeek V4 Pro high | DeepSeek | 1 | 2.9 | 0/3 | 205.7s |