Kegagalan kategori AI BENCHY
Parsing dan ekstraksi data
Format tambahan
Parsing dan ekstraksi data
Format tambahan
Lihat model AI mana yang paling mungkin mengalami Format tambahan di Parsing dan ekstraksi data, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Tes benar ↑.
Alasan kegagalan terkait
Kategori terkait
| Peringkat | Model | Perusahaan | Jumlah Format tambahan | Skor kategori | Tes benar | Waktu respons (rata-rata) |
|---|---|---|---|---|---|---|
| #54 | MiMo-V2-Flash none | Xiaomi | 1 | 10.0 | 0/2 | 19.7s |