AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY زمرہ ناکامیاں

ڈومین مخصوص: ٹائم آؤٹ

ڈومین مخصوص
ٹائم آؤٹ

دیکھیں کہ ڈومین مخصوص میں کن AI ماڈلز کو ٹائم آؤٹ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.

دکھائے گئے ماڈلز

15

کل ناکامیاں

31

سب سے زیادہ متاثر ماڈل

MiniMax M2.5 1
درجہ ماڈل کمپنی ٹائم آؤٹ کی تعداد زمرہ اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#71 MiniMax M2.5 medium Minimax 1 2.9 0/3 237.3s
#57 GPT-5 Nano medium OpenAI 1 5.2 1/3 204.0s
#34 Kimi K2.6 medium Moonshot AI 2 5.3 1/3 202.4s
#32 Qwen3.5-Flash medium Qwen 1 5.3 1/3 146.5s
#97 Qwen3.5-9B medium Qwen 3 3.6 0/3 137.7s
#46 Kimi K2.5 medium Moonshot AI 1 3.5 0/3 137.3s
#52 Grok 4.1 Fast medium X AI 1 5.8 1/3 121.8s
#43 Qwen3.5-35B-A3B medium Qwen 2 4.1 0/3 88.3s
#10 Qwen3.5-27B medium Qwen 1 5.3 1/3 79.5s
#40 GPT-5.2 medium OpenAI 1 5.9 1/3 77.8s
#18 GLM 5 Turbo medium Z.ai 1 2.9 0/3 71.1s
#45 GPT-5 Mini medium OpenAI 1 3.6 0/3 44.6s
#27 DeepSeek V3.2 medium DeepSeek 1 5.3 1/3 39.3s
#33 GLM 5.1 medium Z.ai 1 5.3 1/3 29.8s
#24 Gemma 4 26B A4B medium Google 1 2.9 0/3 23.6s

ٹائم آؤٹ کی تعداد کے لحاظ سے سرفہرست ماڈلز

ٹائم آؤٹ کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز