AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY श्रेणी

टूल कॉलिंग रैंकिंग

देखें कि टूल कॉलिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

15

औसत टूल कॉलिंग स्कोर

8.7

सर्वश्रेष्ठ मॉडल

Gemini 3.5 Flash 3.0
रैंक मॉडल कंपनी टूल कॉलिंग स्कोर स्कोर सही परीक्षण प्रतिक्रिया समय (औसत)
#35 Gemini 3 PRO Preview medium Google 10.0 7.6 1/1 12.0s
#130 MiniMax M2.7 medium Minimax 4.7 5.3 0/1 12.0s
#19 Seed-2.0-Lite medium Bytedance Seed 10.0 8.2 1/1 12.4s
#13 Grok 4.20 Beta medium X AI 3.0 8.5 0/1 12.4s
#59 GLM 5V Turbo medium Z.ai 7.0 7.2 0/1 12.5s
#1 Gemini 3 Flash Preview medium Google 10.0 9.8 1/1 12.6s
#47 Grok Build 0.1 medium X AI 10.0 7.4 1/1 13.1s
#21 GPT-5.4 medium OpenAI 10.0 8.0 1/1 13.3s
#65 Grok 4.20 medium X AI 3.0 7.1 0/1 13.7s
#80 Mimo V2 Omni medium Xiaomi 10.0 6.7 1/1 14.0s
#135 Kimi K2.5 none Moonshot AI 10.0 5.2 1/1 14.0s
#36 Qwen3.5 Plus 2026-04-20 medium Qwen 10.0 7.6 1/1 14.7s
#18 Qwen3.7 Plus medium Qwen 10.0 8.2 1/1 15.0s
#33 Hy3 preview medium Tencent 10.0 7.7 1/1 15.0s
#129 MiniMax M2.5 medium Minimax 10.0 5.3 1/1 15.4s

टूल कॉलिंग स्कोर के अनुसार शीर्ष मॉडल

टूल कॉलिंग स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल