AI BENCHY
Advertise here

AI BENCHY श्रेणी

टूल कॉलिंग क्रमवारी

टूल कॉलिंग मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↑.

दाखवलेली मॉडेल्स

15

सरासरी टूल कॉलिंग स्कोअर

8.7

सर्वोत्तम मॉडेल

Gemini 3.5 Flash 3.0
क्रमांक मॉडेल कंपनी टूल कॉलिंग स्कोअर स्कोअर बरोबर चाचण्या प्रतिसाद वेळ (सरासरी)
#17 GLM 5 medium Z.ai 10.0 8.3 1/1 15.9s
#158 GLM 4.7 Flash medium Z.ai 10.0 4.4 1/1 15.9s
#141 Nemotron 3 Super none NVIDIA 4.7 4.9 0/1 16.0s
#43 MiMo-V2.5-Pro medium Xiaomi 10.0 7.5 1/1 16.9s
#78 Qwen3.6 27B medium Qwen 10.0 6.8 1/1 16.9s
#79 Hunter Alpha medium OpenRouter 10.0 6.7 1/1 17.3s
#38 Grok 4.3 medium X AI 10.0 7.6 1/1 17.7s
#89 Hy3 preview low Tencent 2.8 6.4 0/1 17.8s
#14 Qwen3.6 Max Preview medium Qwen 10.0 8.5 1/1 18.3s
#54 GPT-5 Mini medium OpenAI 10.0 7.3 1/1 18.6s
#138 Ling-2.6-flash none Inclusionai 3.0 5.0 0/1 18.8s
#103 DeepSeek V4 Pro high DeepSeek 10.0 6.0 1/1 21.3s
#121 Owl Alpha none Openrouter 10.0 5.5 1/1 22.8s
#4 Gemini 3.1 Pro Preview medium Google 10.0 9.4 1/1 23.1s
#159 Ling-2.6-1T none Inclusionai 3.0 4.3 0/1 25.7s

टूल कॉलिंग स्कोअर नुसार शीर्ष मॉडेल्स

टूल कॉलिंग स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स