AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY زمرہ ناکامیاں

پہیلی حل کرنا: API خرابی

پہیلی حل کرنا
API خرابی

دیکھیں کہ پہیلی حل کرنا میں کن AI ماڈلز کو API خرابی پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.

دکھائے گئے ماڈلز

12

کل ناکامیاں

13

سب سے زیادہ متاثر ماڈل

DeepSeek V4 Pro 1
درجہ ماڈل کمپنی API خرابی کی تعداد زمرہ اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#103 DeepSeek V4 Pro high DeepSeek 1 5.9 1/3 34.8s
#82 Hy3 preview high Tencent 1 7.7 2/3 27.9s
#92 Laguna M.1 medium Poolside 1 5.3 1/3 10.2s
#93 Qwen3.6 Plus Preview medium Qwen 2 5.3 1/3 7.52s
#89 Hy3 preview low Tencent 1 5.3 1/3 7.51s
#133 DeepSeek V3.2 none DeepSeek 1 7.6 2/3 6.91s
#107 Laguna Xs.2 medium Poolside 1 5.3 1/3 1.93s
#160 LFM2-24B-A2B none Liquid 1 3.8 0/3 1.78s
#149 Nemotron 3 Nano Omni 30b A3b Reasoning medium NVIDIA 1 2.9 0/3 1.40s
#145 Laguna M.1 none Poolside 1 3.0 0/3 891ms
#146 Laguna Xs.2 none Poolside 1 5.3 1/3 650ms
#162 Nemotron 3 Nano Omni 30b A3b Reasoning none NVIDIA 1 3.0 0/3 532ms

API خرابی کی تعداد کے لحاظ سے سرفہرست ماڈلز

API خرابی کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز