AI BENCHY
Advertise here

AI BENCHY زمرہ ناکامیاں

کوڈنگ: کوئی جواب نہیں

کوڈنگ
کوئی جواب نہیں

دیکھیں کہ کوڈنگ میں کن AI ماڈلز کو کوئی جواب نہیں پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.

دکھائے گئے ماڈلز

15

کل ناکامیاں

18

سب سے زیادہ متاثر ماڈل

Gemma 4 26B A4B 1
درجہ ماڈل کمپنی کوئی جواب نہیں کی تعداد زمرہ اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#47 Gemma 4 26B A4B medium Google 1 2.9 0/2 258.4s
#70 Qwen3.5-35B-A3B medium Qwen 1 6.5 1/2 244.5s
#79 Kimi K2.5 medium Moonshot AI 1 4.1 0/2 215.9s
#72 MiMo-V2-Omni medium Xiaomi 1 3.4 0/2 183.9s
#83 Qwen3.6 27B medium Qwen 1 6.6 1/2 165.4s
#51 GLM 5.1 medium Z.ai 1 4.7 0/2 145.6s
#151 Qwen3.5-9B medium Qwen 1 2.8 0/2 135.6s
#54 Kimi K2.6 medium Moonshot AI 1 6.5 1/2 118.2s
#23 Gemma 4 31B medium Google 1 3.8 0/2 110.9s
#58 Step 3.5 Flash medium Stepfun 1 3.0 0/1 62.8s
#30 Qwen3.6 35B A3B medium Qwen 1 6.6 1/2 59.3s
#148 GLM 4.7 Flash medium Z.ai 1 3.4 0/2 55.3s
#133 MiniMax M2.7 medium Minimax 1 6.7 1/2 54.7s
#28 GLM 5 Turbo medium Z.ai 1 7.3 1/2 53.9s
#80 DeepSeek V4 Pro high DeepSeek 1 2.8 0/2 51.8s

کوئی جواب نہیں کی تعداد کے لحاظ سے سرفہرست ماڈلز

کوئی جواب نہیں کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز