Kegagalan kategori AI BENCHY
Spesifik domain: Tidak mengikuti instruksi
Spesifik domain
Tidak mengikuti instruksi
Lihat model AI mana yang paling mungkin mengalami Tidak mengikuti instruksi di Spesifik domain, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Tes benar ↓.
Alasan kegagalan
| Peringkat | Model | Perusahaan | Jumlah Tidak mengikuti instruksi | Skor kategori | Tes benar | Waktu respons (rata-rata) |
|---|---|---|---|---|---|---|
| #82 | Grok Build 0.1 none | X AI | 1 | 3.6 | 0/3 | 103.7s |