AI BENCHY Categoriefouten
Instructies opvolgen: Geen antwoord
Instructies opvolgen
Geen antwoord
Zie welke AI-modellen op Instructies opvolgen het meest kans hebben op Geen antwoord, zodat je zwakke punten sneller ziet. Sorteren op: Responstijd (gem.) โ.
| Rang | Model | Bedrijf | Geen antwoord-aantal | Categoriescore | Correcte tests | Responstijd (gem.) |
|---|---|---|---|---|---|---|
| #53 | Gemini 3.1 Flash Lite high | 1 | 7.3 | 1/2 | 23.3s | |
| #161 | Qwen3.5-9B medium | Qwen | 1 | 6.5 | 1/2 | 5.75s |