Kegagalan kategori AI BENCHY
Kepatuhan instruksi: Kesalahan API
Kepatuhan instruksi
Kesalahan API
Lihat model AI mana yang paling mungkin mengalami Kesalahan API di Kepatuhan instruksi, agar Anda bisa menemukan titik lemahnya lebih cepat.
Alasan kegagalan
| Peringkat | Model | Perusahaan | Jumlah Kesalahan API | Skor kategori | Tes benar | Waktu respons (rata-rata) |
|---|---|---|---|---|---|---|
| #93 | Qwen3.6 Plus Preview medium | Qwen | 1 | 6.5 | 1/2 | 3.40s |