AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY زمرہ

معلومات عامہ درجہ بندی

دیکھیں کہ معلومات عامہ میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.

دکھائے گئے ماڈلز

15

اوسط معلومات عامہ اسکور

2.9

بہترین ماڈل

MiMo-V2-Omni 3.0
درجہ ماڈل کمپنی معلومات عامہ اسکور اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#62 MiMo-V2-Omni medium Xiaomi 3.0 7.2 0/1 234.2s
#38 Gemma 4 26B A4B medium Google 3.0 7.7 0/1 180.9s
#57 Qwen3.5-35B-A3B medium Qwen 3.0 7.2 0/1 177.4s
#140 Qwen3.5-9B medium Qwen 3.0 4.3 0/1 177.0s
#42 Kimi K2.6 medium Moonshot AI 3.0 7.6 0/1 130.3s
#50 Qwen3.6 Flash medium Qwen 3.0 7.5 0/1 122.9s
#36 Step 3.5 Flash none Stepfun 3.0 7.8 0/1 114.1s
#43 Step 3.5 Flash medium Stepfun 3.0 7.6 0/1 108.4s
#12 Qwen3.5 Plus 2026-02-15 medium Qwen 3.0 8.2 0/1 103.8s
#33 Qwen3.5 Plus 2026-04-20 medium Qwen 3.0 7.8 0/1 92.6s
#14 Gemma 4 31B medium Google 3.0 8.2 0/1 90.1s
#17 Qwen3.5-27B medium Qwen 3.0 8.1 0/1 85.1s
#59 DeepSeek V3.2 medium DeepSeek 3.0 7.2 0/1 84.0s
#69 Kimi K2.5 medium Moonshot AI 3.0 6.8 0/1 83.9s
#37 MiMo-V2-Pro medium Xiaomi 3.0 7.7 0/1 82.7s

معلومات عامہ اسکور کے لحاظ سے سرفہرست ماڈلز

معلومات عامہ اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز