AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY زمرہ

ڈومین مخصوص درجہ بندی

دیکھیں کہ ڈومین مخصوص میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↑.

دکھائے گئے ماڈلز

15

اوسط ڈومین مخصوص اسکور

4.8

بہترین ماڈل

GLM 5 3.5
درجہ ماڈل کمپنی ڈومین مخصوص اسکور اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#42 GPT-5.2 medium OpenAI 5.9 7.5 1/3 77.8s
#30 Qwen3.5-27B medium Qwen 5.3 7.8 1/3 79.5s
#69 Claude Opus 4.6 medium Anthropic 3.0 7.0 0/3 83.4s
#66 Qwen3.5-35B-A3B medium Qwen 4.1 7.1 0/3 88.3s
#19 Seed-2.0-Lite medium Bytedance Seed 5.9 8.2 1/3 88.7s
#14 Qwen3.6 Max Preview medium Qwen 2.9 8.5 0/3 95.9s
#64 MiMo-V2-Flash medium Xiaomi 5.9 7.2 1/3 96.0s
#31 DeepSeek V4 Flash high DeepSeek 4.1 7.7 0/3 100.3s
#100 Grok Build 0.1 none X AI 3.6 6.0 0/3 103.7s
#82 Hy3 preview high Tencent 5.3 6.6 1/3 109.0s
#86 Grok 4.1 Fast medium X AI 5.8 6.5 1/3 121.8s
#12 Gemini 3.1 Flash Lite Preview high Google 5.3 8.6 1/3 127.6s
#119 Cobuddy medium Baidu 2.9 5.6 0/3 128.2s
#76 Kimi K2.5 medium Moonshot AI 3.5 6.8 0/3 137.3s
#161 Qwen3.5-9B medium Qwen 3.6 4.2 0/3 137.7s

ڈومین مخصوص اسکور کے لحاظ سے سرفہرست ماڈلز

ڈومین مخصوص اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز