Kegagalan kategori AI BENCHY
Trik anti-AI: Tidak mengikuti instruksi
Trik anti-AI
Tidak mengikuti instruksi
Lihat model AI mana yang paling mungkin mengalami Tidak mengikuti instruksi di Trik anti-AI, agar Anda bisa menemukan titik lemahnya lebih cepat.
Model yang ditampilkan
2
Total kegagalan
17
Model yang paling terdampak
Gemini 3.1 Flash Lite Preview 1Alasan kegagalan
| Peringkat | Model | Perusahaan | Jumlah Tidak mengikuti instruksi | Skor kategori | Tes benar | Waktu respons (rata-rata) |
|---|---|---|---|---|---|---|
| #93 | GLM 4.7 Flash medium | Z.ai | 1 | 4.7 | 1/4 | 15.0s |
| #95 | Grok 4.1 Fast none | X AI | 1 | 3.2 | 0/4 | 1.07s |