Eșecuri pe categorii AI BENCHY
Apelare instrumente
Fără răspuns
Apelare instrumente
Fără răspuns
Vezi ce modele AI au cele mai mari șanse să întâmpine Fără răspuns la Apelare instrumente, ca să găsești mai repede punctele slabe. Sortează după: Număr de eșecuri ↑.
Motive de eșec asociate
| Rang | Model | Companie | Număr de Fără răspuns | Scor de categorie | Teste corecte | Timp de răspuns (mediu) |
|---|---|---|---|---|---|---|
| #27 | GPT-5.2 medium | OpenAI | 1 | 10.0 | 0/1 | 10.3s |
| #30 | Grok 4.1 Fast medium | X AI | 1 | 10.0 | 0/1 | 27.7s |