Eșecuri pe categorii AI BENCHY
Parsare și extragere de date
Eroare API
Parsare și extragere de date
Eroare API
Vezi ce modele AI au cele mai mari șanse să întâmpine Eroare API la Parsare și extragere de date, ca să găsești mai repede punctele slabe. Sortează după: Timp de răspuns (mediu) ↓.
Motive de eșec asociate
| Rang | Model | Companie | Număr de Eroare API | Scor de categorie | Teste corecte | Timp de răspuns (mediu) |
|---|---|---|---|---|---|---|
| #35 | Qwen3.5-35B-A3B medium | Qwen | 1 | 5.5 | 1/2 | 59.3s |
| #24 | Qwen3.5-Flash medium | Qwen | 1 | 5.5 | 1/2 | 57.0s |
| #54 | MiMo-V2-Flash none | Xiaomi | 1 | 10.0 | 0/2 | 19.7s |
| #21 | MiMo-V2-Flash medium | Xiaomi | 1 | 5.5 | 1/2 | 0ms |