Kegagalan kategori AI BENCHY
Gabungan: Tidak mengikuti instruksi
Gabungan
Tidak mengikuti instruksi
Lihat model AI mana yang paling mungkin mengalami Tidak mengikuti instruksi di Gabungan, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Waktu respons (rata-rata) ↑.
Alasan kegagalan
1/1
Filter model
Tidak ada model yang cocok dengan pencarian dan filter saat ini.
| Peringkat | Model | Perusahaan | Jumlah Tidak mengikuti instruksi | Skor kategori | Total Biaya | Tes benar | Waktu respons (rata-rata) |
|---|---|---|---|---|---|---|---|
| #119 | MiMo-V2.5-Pro none | Xiaomi | 1 | 3.0 | $0.017 | 0/1 | 3.54s |