AI BENCHY Categoriefouten
Algemene kennis: Geen antwoord
Algemene kennis
Geen antwoord
Zie welke AI-modellen op Algemene kennis het meest kans hebben op Geen antwoord, zodat je zwakke punten sneller ziet. Sorteren op: Responstijd (gem.) โ.
Foutredenen
| Rang | Model | Bedrijf | Geen antwoord-aantal | Categoriescore | Correcte tests | Responstijd (gem.) |
|---|---|---|---|---|---|---|
| #71 | Step 3.7 Flash high | Stepfun | 1 | 3.0 | 0/1 | 149.3s |
| #57 | Step 3.7 Flash low | Stepfun | 1 | 3.0 | 0/1 | 124.8s |
| #22 | Step 3.7 Flash medium | Stepfun | 1 | 3.0 | 0/1 | 114.0s |
| #67 | MiniMax M3 medium | Minimax | 1 | 3.0 | 0/1 | 100.8s |
| #10 | Claude Opus 4.8 medium | Anthropic | 1 | 3.0 | 0/1 | 6.14s |
| #68 | Claude Opus 4.8 none | Anthropic | 1 | 3.0 | 0/1 | 3.41s |