Kegagalan kategori AI BENCHY
Pemanggilan alat: Kesalahan API
Pemanggilan alat
Kesalahan API
Lihat model AI mana yang paling mungkin mengalami Kesalahan API di Pemanggilan alat, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Tes benar ↑.
Alasan kegagalan
| Peringkat | Model | Perusahaan | Jumlah Kesalahan API | Skor kategori | Tes benar | Waktu respons (rata-rata) |
|---|---|---|---|---|---|---|
| #14 | Gemma 4 31B medium | 1 | 3.0 | 0/1 | 0ms | |
| #33 | GLM 5.1 medium | Z.ai | 1 | 3.0 | 0/1 | 0ms |
| #48 | Gemma 4 31B none | 1 | 3.0 | 0/1 | 0ms | |
| #56 | Grok 4.20 Multi Agent Beta medium | X AI | 1 | 3.0 | 0/1 | 0ms |
| #84 | gpt-oss-120b none | OpenAI | 1 | 3.0 | 0/1 | 0ms |
| #98 | LFM2-24B-A2B none | Liquid | 1 | 3.0 | 0/1 | 0ms |