AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY زمرہ ناکامیاں

ڈومین مخصوص: API خرابی

ڈومین مخصوص
API خرابی

دیکھیں کہ ڈومین مخصوص میں کن AI ماڈلز کو API خرابی پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: درست ٹیسٹس ↑.

دکھائے گئے ماڈلز

6

کل ناکامیاں

6

سب سے زیادہ متاثر ماڈل

Qwen3.6 Plus Preview 1
درجہ ماڈل کمپنی API خرابی کی تعداد زمرہ اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#93 Qwen3.6 Plus Preview medium Qwen 1 3.0 0/3 22.1s
#103 DeepSeek V4 Pro high DeepSeek 1 2.9 0/3 205.7s
#133 DeepSeek V3.2 none DeepSeek 1 2.9 0/3 4.17s
#156 Hy3 preview none Tencent 1 3.6 0/3 17.6s
#132 Mistral Small 4 medium Mistral 1 5.3 1/3 6.11s
#160 LFM2-24B-A2B none Liquid 1 5.9 1/3 287ms

API خرابی کی تعداد کے لحاظ سے سرفہرست ماڈلز

API خرابی کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز