AI BENCHY
موازنہ کریں چارٹس طریقہ کار
❤️ Made by XCS
Your ad here

AI BENCHY ناکامیاں

API خرابی ناکامیاں

دیکھیں کہ کن AI ماڈلز میں API خرابی سب سے زیادہ ہوتا ہے، تاکہ آپ انتخاب سے پہلے قابلِ اعتماد ہونے کے خطرات سمجھ سکیں۔ ترتیب دیں حسب: درست ٹیسٹس ↑.

دکھائے گئے ماڈلز

5

کل ناکامیاں

8

سب سے زیادہ متاثر ماڈل

LFM2-24B-A2B 4
درجہ ماڈل کمپنی API خرابی کی تعداد اوسط اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#55 LFM2-24B-A2B none Liquid 4 2.6 1/16 811ms
#54 MiMo-V2-Flash none Xiaomi 1 2.9 3/16 2.97s
#35 Qwen3.5-35B-A3B medium Qwen 1 5.5 8/16 43.9s
#24 Qwen3.5-Flash medium Qwen 1 6.9 10/16 70.8s
#21 MiMo-V2-Flash medium Xiaomi 1 7.2 11/16 25.3s

API خرابی کی تعداد کے لحاظ سے سرفہرست ماڈلز

API خرابی کی تعداد بمقابلہ اوسط اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز