Kegagalan kategori AI BENCHY
Gabungan: Tidak mengikuti instruksi
Gabungan
Tidak mengikuti instruksi
Lihat model AI mana yang paling mungkin mengalami Tidak mengikuti instruksi di Gabungan, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Tes benar ↓.
Alasan kegagalan
| Peringkat | Model | Perusahaan | Jumlah Tidak mengikuti instruksi | Skor kategori | Tes benar | Waktu respons (rata-rata) |
|---|---|---|---|---|---|---|
| #81 | MiMo-V2.5-Pro none | Xiaomi | 1 | 3.0 | 0/1 | 3.54s |