AI BENCHY
Advertise here

AI BENCHY زمرہ

ٹول کالنگ درجہ بندی

دیکھیں کہ ٹول کالنگ میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↑.

دکھائے گئے ماڈلز

15

اوسط ٹول کالنگ اسکور

8.7

بہترین ماڈل

Gemini 3.5 Flash 3.0
درجہ ماڈل کمپنی ٹول کالنگ اسکور اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#17 GLM 5 medium Z.ai 10.0 8.3 1/1 15.9s
#158 GLM 4.7 Flash medium Z.ai 10.0 4.4 1/1 15.9s
#141 Nemotron 3 Super none NVIDIA 4.7 4.9 0/1 16.0s
#43 MiMo-V2.5-Pro medium Xiaomi 10.0 7.5 1/1 16.9s
#78 Qwen3.6 27B medium Qwen 10.0 6.8 1/1 16.9s
#79 Hunter Alpha medium OpenRouter 10.0 6.7 1/1 17.3s
#38 Grok 4.3 medium X AI 10.0 7.6 1/1 17.7s
#89 Hy3 preview low Tencent 2.8 6.4 0/1 17.8s
#14 Qwen3.6 Max Preview medium Qwen 10.0 8.5 1/1 18.3s
#54 GPT-5 Mini medium OpenAI 10.0 7.3 1/1 18.6s
#138 Ling-2.6-flash none Inclusionai 3.0 5.0 0/1 18.8s
#103 DeepSeek V4 Pro high DeepSeek 10.0 6.0 1/1 21.3s
#121 Owl Alpha none Openrouter 10.0 5.5 1/1 22.8s
#4 Gemini 3.1 Pro Preview medium Google 10.0 9.4 1/1 23.1s
#159 Ling-2.6-1T none Inclusionai 3.0 4.3 0/1 25.7s

ٹول کالنگ اسکور کے لحاظ سے سرفہرست ماڈلز

ٹول کالنگ اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز