AI BENCHY Categoriefouten
Toolaanroepen: Ongeldige toolaanroep
Toolaanroepen
Ongeldige toolaanroep
Zie welke AI-modellen op Toolaanroepen het meest kans hebben op Ongeldige toolaanroep, zodat je zwakke punten sneller ziet. Sorteren op: Responstijd (gem.) โ.
Foutredenen
Categorieรซn
| Rang | Model | Bedrijf | Ongeldige toolaanroep-aantal | Categoriescore | Correcte tests | Responstijd (gem.) |
|---|---|---|---|---|---|---|
| #31 | GLM 5V Turbo medium | Z.ai | 1 | 7.0 | 0/1 | 12.5s |
| #81 | Elephant medium | Openrouter | 1 | 3.0 | 0/1 | 2.83s |
| #85 | Elephant none | Openrouter | 1 | 3.0 | 0/1 | 2.79s |