AI BENCHY
Your ad here

AI BENCHY श्रेणी

टूल कॉलिंग क्रमवारी

टूल कॉलिंग मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा.

दाखवलेली मॉडेल्स

8

सरासरी टूल कॉलिंग स्कोअर

8.7

सर्वोत्तम मॉडेल

Gemini 3 Flash Preview 10.0
क्रमांक मॉडेल कंपनी टूल कॉलिंग स्कोअर स्कोअर बरोबर चाचण्या प्रतिसाद वेळ (सरासरी)
#81 Elephant medium Openrouter 3.0 5.2 0/1 2.83s
#84 gpt-oss-120b none OpenAI 3.0 5.2 0/1 0ms
#85 Elephant none Openrouter 3.0 5.2 0/1 2.79s
#86 GPT-5.4 Mini none OpenAI 3.0 5.1 0/1 2.32s
#98 LFM2-24B-A2B none Liquid 3.0 4.1 0/1 0ms
#52 Grok 4.1 Fast medium X AI 2.8 6.7 0/1 27.7s
#74 GLM 4.7 Flash none Z.ai 2.8 5.6 0/1 7.05s
#95 Grok 4.1 Fast none X AI 2.8 4.5 0/1 5.51s

टूल कॉलिंग स्कोअर नुसार शीर्ष मॉडेल्स

टूल कॉलिंग स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स