Eșecuri pe categorii AI BENCHY
Apelare instrumente: Eroare API
Apelare instrumente
Eroare API
Vezi ce modele AI au cele mai mari șanse să întâmpine Eroare API la Apelare instrumente, ca să găsești mai repede punctele slabe.
Motive de eșec
| Rang | Model | Companie | Număr de Eroare API | Scor de categorie | Teste corecte | Timp de răspuns (mediu) |
|---|---|---|---|---|---|---|
| #14 | Gemma 4 31B medium | 1 | 3.0 | 0/1 | 0ms | |
| #33 | GLM 5.1 medium | Z.ai | 1 | 3.0 | 0/1 | 0ms |
| #48 | Gemma 4 31B none | 1 | 3.0 | 0/1 | 0ms | |
| #56 | Grok 4.20 Multi Agent Beta medium | X AI | 1 | 3.0 | 0/1 | 0ms |
| #84 | gpt-oss-120b none | OpenAI | 1 | 3.0 | 0/1 | 0ms |
| #98 | LFM2-24B-A2B none | Liquid | 1 | 3.0 | 0/1 | 0ms |