AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Kegagalan kategori AI BENCHY

Pemanggilan alat: Kesalahan API

Pemanggilan alat
Kesalahan API

Lihat model AI mana yang paling mungkin mengalami Kesalahan API di Pemanggilan alat, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Waktu respons (rata-rata) ↑.

Model yang ditampilkan

6

Total kegagalan

6

Model yang paling terdampak

Gemma 4 31B 1
Peringkat Model Perusahaan Jumlah Kesalahan API Skor kategori Tes benar Waktu respons (rata-rata)
#14 Gemma 4 31B medium Google 1 3.0 0/1 0ms
#33 GLM 5.1 medium Z.ai 1 3.0 0/1 0ms
#48 Gemma 4 31B none Google 1 3.0 0/1 0ms
#56 Grok 4.20 Multi Agent Beta medium X AI 1 3.0 0/1 0ms
#84 gpt-oss-120b none OpenAI 1 3.0 0/1 0ms
#98 LFM2-24B-A2B none Liquid 1 3.0 0/1 0ms

Model teratas menurut Jumlah Kesalahan API

Jumlah Kesalahan API vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang