AI BENCHY
Your ad here

Kategori AI BENCHY

Peringkat Pemanggilan alat

Lihat model AI mana yang paling baik di Pemanggilan alat, mana yang tetap andal, dan di mana kesenjangan terbesar muncul.

Model yang ditampilkan

8

Rata-rata Skor Pemanggilan alat

8.7

Peringkat Model Perusahaan Skor Pemanggilan alat Skor Tes benar Waktu respons (rata-rata)
#81 Elephant medium Openrouter 3.0 5.2 0/1 2.83s
#84 gpt-oss-120b none OpenAI 3.0 5.2 0/1 0ms
#85 Elephant none Openrouter 3.0 5.2 0/1 2.79s
#86 GPT-5.4 Mini none OpenAI 3.0 5.1 0/1 2.32s
#98 LFM2-24B-A2B none Liquid 3.0 4.1 0/1 0ms
#52 Grok 4.1 Fast medium X AI 2.8 6.7 0/1 27.7s
#74 GLM 4.7 Flash none Z.ai 2.8 5.6 0/1 7.05s
#95 Grok 4.1 Fast none X AI 2.8 4.5 0/1 5.51s

Model teratas menurut Skor Pemanggilan alat

Skor Pemanggilan alat vs total biaya

Model teratas menurut Waktu respons (rata-rata)