AI BENCHY
Your ad here

AI BENCHY زمرہ

مشترکہ درجہ بندی

دیکھیں کہ مشترکہ میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: درست ٹیسٹس ↑.

دکھائے گئے ماڈلز

15

اوسط مشترکہ اسکور

6.2

بہترین ماڈل

Gemini 3 Flash Preview 3.0
درجہ ماڈل کمپنی مشترکہ اسکور اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#58 GLM 5V Turbo none Z.ai 3.0 6.2 0/1 6.51s
#59 Qwen3.5-Flash none Qwen 3.0 6.2 0/1 6.22s
#60 Gemma 4 26B A4B none Google 3.0 6.2 0/1 30.5s
#61 Seed-2.0-Lite none Bytedance Seed 3.0 6.2 0/1 6.59s
#62 Gemini 2.5 Flash none Google 3.0 6.2 0/1 4.39s
#63 Qwen3.5-35B-A3B none Qwen 3.0 6.1 0/1 47.4s
#64 DeepSeek V3.2 none DeepSeek 6.5 6.1 0/1 115.9s
#65 MiMo-V2-Pro none Xiaomi 3.0 6.0 0/1 6.58s
#66 GPT-5.4 none OpenAI 3.0 5.9 0/1 2.89s
#67 Qwen3.5-27B none Qwen 2.8 5.9 0/1 9.39s
#69 Kimi K2.6 none Moonshot AI 3.0 5.8 0/1 3.38s
#70 Qwen3.5-122B-A10B none Qwen 3.0 5.7 0/1 46.0s
#71 MiniMax M2.5 medium Minimax 4.5 5.7 0/1 60.4s
#72 Hunter Alpha none OpenRouter 3.0 5.7 0/1 15.2s
#73 Mistral Small 4 medium Mistral 3.0 5.7 0/1 25.3s

مشترکہ اسکور کے لحاظ سے سرفہرست ماڈلز

مشترکہ اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز