AI BENCHY
Advertise here

AI BENCHY زمرہ ناکامیاں

ہدایات کی پیروی: کوئی جواب نہیں

ہدایات کی پیروی
کوئی جواب نہیں

دیکھیں کہ ہدایات کی پیروی میں کن AI ماڈلز کو کوئی جواب نہیں پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔

دکھائے گئے ماڈلز

2

کل ناکامیاں

2

سب سے زیادہ متاثر ماڈل

Gemini 3.1 Flash Lite 1

کوئی جواب نہیں کی تعداد کے لحاظ سے سرفہرست ماڈلز

کوئی جواب نہیں کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز