AI BENCHY श्रेणी
टूल कॉलिंग रैंकिंग
देखें कि टूल कॉलिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।
| रैंक | मॉडल | कंपनी | टूल कॉलिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #81 | Elephant medium | Openrouter | 3.0 | 5.2 | 0/1 | 2.83s |
| #84 | gpt-oss-120b none | OpenAI | 3.0 | 5.2 | 0/1 | 0ms |
| #85 | Elephant none | Openrouter | 3.0 | 5.2 | 0/1 | 2.79s |
| #86 | GPT-5.4 Mini none | OpenAI | 3.0 | 5.1 | 0/1 | 2.32s |
| #98 | LFM2-24B-A2B none | Liquid | 3.0 | 4.1 | 0/1 | 0ms |
| #52 | Grok 4.1 Fast medium | X AI | 2.8 | 6.7 | 0/1 | 27.7s |
| #74 | GLM 4.7 Flash none | Z.ai | 2.8 | 5.6 | 0/1 | 7.05s |
| #95 | Grok 4.1 Fast none | X AI | 2.8 | 4.5 | 0/1 | 5.51s |