AI BENCHY Categoriefouten
Gecombineerd: Instructies niet gevolgd
Gecombineerd
Instructies niet gevolgd
Zie welke AI-modellen op Gecombineerd het meest kans hebben op Instructies niet gevolgd, zodat je zwakke punten sneller ziet. Sorteren op: Correcte tests โ.
Foutredenen
| Rang | Model | Bedrijf | Instructies niet gevolgd-aantal | Categoriescore | Correcte tests | Responstijd (gem.) |
|---|---|---|---|---|---|---|
| #81 | MiMo-V2.5-Pro none | Xiaomi | 1 | 3.0 | 0/1 | 3.54s |