AI BENCHY
Advertise here

AI BENCHY श्रेणी

टूल कॉलिंग क्रमवारी

टूल कॉलिंग मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↑.

दाखवलेली मॉडेल्स

15

सरासरी टूल कॉलिंग स्कोअर

8.7

सर्वोत्तम मॉडेल

Gemini 3.5 Flash 3.0
क्रमांक मॉडेल कंपनी टूल कॉलिंग स्कोअर स्कोअर बरोबर चाचण्या प्रतिसाद वेळ (सरासरी)
#125 GPT-5.4 none OpenAI 10.0 5.5 1/1 2.75s
#137 Elephant Alpha none Openrouter 3.0 5.1 0/1 2.79s
#32 Gemini 3.5 Flash minimal Google 10.0 7.7 1/1 2.79s
#71 Step 3.7 Flash high Stepfun 10.0 7.0 1/1 2.79s
#136 Elephant Alpha medium Openrouter 3.0 5.1 0/1 2.83s
#90 Gemini 3.1 Flash Lite none Google 10.0 6.4 1/1 2.97s
#104 Nemotron 3 Ultra 550b A55b none NVIDIA 10.0 6.0 1/1 2.99s
#57 Step 3.7 Flash low Stepfun 10.0 7.3 1/1 3.25s
#3 Gemini 3.5 Flash low Google 10.0 9.4 1/1 3.27s
#123 MiMo-V2.5-Pro none Xiaomi 10.0 5.5 1/1 3.30s
#95 Qwen3.5 Plus 2026-02-15 none Qwen 10.0 6.3 1/1 3.33s
#48 Gemini 3 Flash Preview none Google 10.0 7.4 1/1 3.35s
#58 Gemini 3.1 Flash Lite Preview none Google 10.0 7.2 1/1 3.39s
#107 Laguna Xs.2 medium Poolside 4.7 5.8 0/1 3.39s
#148 GPT-5.4 Nano none OpenAI 10.0 4.7 1/1 3.40s

टूल कॉलिंग स्कोअर नुसार शीर्ष मॉडेल्स

टूल कॉलिंग स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स