AI BENCHY
Your ad here

AI BENCHY श्रेणी

टूल कॉलिंग रैंकिंग

देखें कि टूल कॉलिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।

दिखाए गए मॉडल

8

औसत टूल कॉलिंग स्कोर

8.7

सर्वश्रेष्ठ मॉडल

Gemini 3 Flash Preview 10.0
रैंक मॉडल कंपनी टूल कॉलिंग स्कोर स्कोर सही परीक्षण प्रतिक्रिया समय (औसत)
#81 Elephant medium Openrouter 3.0 5.2 0/1 2.83s
#84 gpt-oss-120b none OpenAI 3.0 5.2 0/1 0ms
#85 Elephant none Openrouter 3.0 5.2 0/1 2.79s
#86 GPT-5.4 Mini none OpenAI 3.0 5.1 0/1 2.32s
#98 LFM2-24B-A2B none Liquid 3.0 4.1 0/1 0ms
#52 Grok 4.1 Fast medium X AI 2.8 6.7 0/1 27.7s
#74 GLM 4.7 Flash none Z.ai 2.8 5.6 0/1 7.05s
#95 Grok 4.1 Fast none X AI 2.8 4.5 0/1 5.51s

टूल कॉलिंग स्कोर के अनुसार शीर्ष मॉडल

टूल कॉलिंग स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल