Kegagalan kategori AI BENCHY
Kepatuhan instruksi: Tidak ada jawaban
Kepatuhan instruksi
Tidak ada jawaban
Lihat model AI mana yang paling mungkin mengalami Tidak ada jawaban di Kepatuhan instruksi, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Waktu respons (rata-rata) ↓.
Alasan kegagalan
| Peringkat | Model | Perusahaan | Jumlah Tidak ada jawaban | Skor kategori | Tes benar | Waktu respons (rata-rata) |
|---|---|---|---|---|---|---|
| #53 | Gemini 3.1 Flash Lite high | 1 | 7.3 | 1/2 | 23.3s | |
| #161 | Qwen3.5-9B medium | Qwen | 1 | 6.5 | 1/2 | 5.75s |