AI BENCHY Categoriefouten
Instructies opvolgen: API-fout
Instructies opvolgen
API-fout
Zie welke AI-modellen op Instructies opvolgen het meest kans hebben op API-fout, zodat je zwakke punten sneller ziet. Sorteren op: Correcte tests โ.
| Rang | Model | Bedrijf | API-fout-aantal | Categoriescore | Correcte tests | Responstijd (gem.) |
|---|---|---|---|---|---|---|
| #47 | Grok 4.20 medium | X AI | 1 | 7.3 | 1/2 | 4.42s |