Kegagalan kategori AI BENCHY
Parsing dan ekstraksi data
Kesalahan API
Parsing dan ekstraksi data
Kesalahan API
Lihat model AI mana yang paling mungkin mengalami Kesalahan API di Parsing dan ekstraksi data, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Tes benar ↑.
Alasan kegagalan terkait
| Peringkat | Model | Perusahaan | Jumlah Kesalahan API | Skor kategori | Tes benar | Waktu respons (rata-rata) |
|---|---|---|---|---|---|---|
| #54 | MiMo-V2-Flash none | Xiaomi | 1 | 10.0 | 0/2 | 19.7s |
| #21 | MiMo-V2-Flash medium | Xiaomi | 1 | 5.5 | 1/2 | 0ms |
| #24 | Qwen3.5-Flash medium | Qwen | 1 | 5.5 | 1/2 | 57.0s |
| #35 | Qwen3.5-35B-A3B medium | Qwen | 1 | 5.5 | 1/2 | 59.3s |