Eșecuri pe categorii AI BENCHY
Parsare și extragere de date
Eroare API
Parsare și extragere de date
Eroare API
Vezi ce modele AI au cele mai mari șanse să întâmpine Eroare API la Parsare și extragere de date, ca să găsești mai repede punctele slabe.
Motive de eșec asociate
| Rang | Model | Companie | Număr de Eroare API | Scor de categorie | Teste corecte | Timp de răspuns (mediu) |
|---|---|---|---|---|---|---|
| #21 | MiMo-V2-Flash medium | Xiaomi | 1 | 5.5 | 1/2 | 0ms |
| #24 | Qwen3.5-Flash medium | Qwen | 1 | 5.5 | 1/2 | 57.0s |
| #35 | Qwen3.5-35B-A3B medium | Qwen | 1 | 5.5 | 1/2 | 59.3s |
| #54 | MiMo-V2-Flash none | Xiaomi | 1 | 10.0 | 0/2 | 19.7s |