AI BENCHY Categoriefouten
Toolaanroepen: API-fout
Toolaanroepen
API-fout
Zie welke AI-modellen op Toolaanroepen het meest kans hebben op API-fout, zodat je zwakke punten sneller ziet. Sorteren op: Responstijd (gem.) โ.
Foutredenen
| Rang | Model | Bedrijf | API-fout-aantal | Categoriescore | Correcte tests | Responstijd (gem.) |
|---|---|---|---|---|---|---|
| #14 | Gemma 4 31B medium | 1 | 3.0 | 0/1 | 0ms | |
| #33 | GLM 5.1 medium | Z.ai | 1 | 3.0 | 0/1 | 0ms |
| #48 | Gemma 4 31B none | 1 | 3.0 | 0/1 | 0ms | |
| #56 | Grok 4.20 Multi Agent Beta medium | X AI | 1 | 3.0 | 0/1 | 0ms |
| #84 | gpt-oss-120b none | OpenAI | 1 | 3.0 | 0/1 | 0ms |
| #98 | LFM2-24B-A2B none | Liquid | 1 | 3.0 | 0/1 | 0ms |