AI BENCHY ناکامیاں
API خرابی ناکامیاں
دیکھیں کہ کن AI ماڈلز میں API خرابی سب سے زیادہ ہوتا ہے، تاکہ آپ انتخاب سے پہلے قابلِ اعتماد ہونے کے خطرات سمجھ سکیں۔ ترتیب دیں حسب: اوسط اسکور ↑.
| درجہ | ماڈل | کمپنی | API خرابی کی تعداد | اوسط اسکور | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|
| #55 | LFM2-24B-A2B none | Liquid | 4 | 2.6 | 1/16 | 811ms |
| #54 | MiMo-V2-Flash none | Xiaomi | 1 | 2.9 | 3/16 | 2.97s |
| #35 | Qwen3.5-35B-A3B medium | Qwen | 1 | 5.5 | 8/16 | 43.9s |
| #24 | Qwen3.5-Flash medium | Qwen | 1 | 6.9 | 10/16 | 70.8s |
| #21 | MiMo-V2-Flash medium | Xiaomi | 1 | 7.2 | 11/16 | 25.3s |