AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY زمرہ

پہیلی حل کرنا درجہ بندی

دیکھیں کہ پہیلی حل کرنا میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: میٹرک ↑.

دکھائے گئے ماڈلز

15

اوسط پہیلی حل کرنا اسکور

6.7

بہترین ماڈل

Ling-2.6-flash 2.9
درجہ ماڈل کمپنی پہیلی حل کرنا اسکور اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#127 Grok 4.20 none X AI 5.3 5.4 1/3 473ms
#136 Elephant Alpha medium Openrouter 5.3 5.1 1/3 868ms
#146 Laguna Xs.2 none Poolside 5.3 4.8 1/3 650ms
#152 MiMo-V2-Flash none Xiaomi 5.3 4.6 1/3 1.86s
#76 Kimi K2.5 medium Moonshot AI 5.3 6.8 1/3 43.2s
#121 Owl Alpha none Openrouter 5.4 5.5 1/3 4.18s
#81 Mercury 2 medium Inception 5.4 6.6 1/3 949ms
#143 MiMo-V2.5 none Xiaomi 5.4 4.9 1/3 2.13s
#144 GPT-5.4 Mini none OpenAI 5.4 4.9 1/3 836ms
#148 GPT-5.4 Nano none OpenAI 5.4 4.7 1/3 1.25s
#41 Nemotron 3 Ultra 550b A55b medium NVIDIA 5.5 7.5 1/3 3.54s
#134 GLM 5 Turbo none Z.ai 5.5 5.2 1/3 2.65s
#141 Nemotron 3 Super none NVIDIA 5.5 4.9 1/3 2.36s
#57 Step 3.7 Flash low Stepfun 5.5 7.3 1/3 1.84s
#125 GPT-5.4 none OpenAI 5.6 5.5 1/3 1.44s

پہیلی حل کرنا اسکور کے لحاظ سے سرفہرست ماڈلز

پہیلی حل کرنا اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز