Kegagalan kategori AI BENCHY
Kepatuhan instruksi: Kesalahan API
Kepatuhan instruksi
Kesalahan API
Lihat model AI mana yang paling mungkin mengalami Kesalahan API di Kepatuhan instruksi, agar Anda bisa menemukan titik lemahnya lebih cepat.
Alasan kegagalan
| Peringkat | Model | Perusahaan | Jumlah Kesalahan API | Skor kategori | Tes benar | Waktu respons (rata-rata) |
|---|---|---|---|---|---|---|
| #47 | Grok 4.20 medium | X AI | 1 | 7.3 | 1/2 | 4.42s |