AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY زمرہ ناکامیاں

کوڈنگ: کوئی جواب نہیں

کوڈنگ
کوئی جواب نہیں

دیکھیں کہ کوڈنگ میں کن AI ماڈلز کو کوئی جواب نہیں پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↑.

دکھائے گئے ماڈلز

15

کل ناکامیاں

18

سب سے زیادہ متاثر ماڈل

Gemini 3 PRO Preview 1
درجہ ماڈل کمپنی کوئی جواب نہیں کی تعداد زمرہ اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#19 Gemini 3 PRO Preview medium Google 1 3.0 0/2 0ms
#122 Elephant Alpha medium Openrouter 1 4.0 0/2 1.30s
#130 Elephant Alpha none Openrouter 1 4.7 0/2 1.39s
#80 DeepSeek V4 Pro high DeepSeek 1 2.8 0/2 51.8s
#28 GLM 5 Turbo medium Z.ai 1 7.3 1/2 53.9s
#133 MiniMax M2.7 medium Minimax 1 6.7 1/2 54.7s
#148 GLM 4.7 Flash medium Z.ai 1 3.4 0/2 55.3s
#30 Qwen3.6 35B A3B medium Qwen 1 6.6 1/2 59.3s
#58 Step 3.5 Flash medium Stepfun 1 3.0 0/1 62.8s
#23 Gemma 4 31B medium Google 1 3.8 0/2 110.9s
#54 Kimi K2.6 medium Moonshot AI 1 6.5 1/2 118.2s
#151 Qwen3.5-9B medium Qwen 1 2.8 0/2 135.6s
#51 GLM 5.1 medium Z.ai 1 4.7 0/2 145.6s
#83 Qwen3.6 27B medium Qwen 1 6.6 1/2 165.4s
#72 MiMo-V2-Omni medium Xiaomi 1 3.4 0/2 183.9s

کوئی جواب نہیں کی تعداد کے لحاظ سے سرفہرست ماڈلز

کوئی جواب نہیں کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز