AI BENCHY Categoriefouten
Anti-AI-trucs: Verkeerd antwoord
Anti-AI-trucs
Verkeerd antwoord
Zie welke AI-modellen op Anti-AI-trucs het meest kans hebben op Verkeerd antwoord, zodat je zwakke punten sneller ziet.
Foutredenen
| Rang | Model | Bedrijf | Verkeerd antwoord-aantal | Categoriescore | Correcte tests | Responstijd (gem.) |
|---|---|---|---|---|---|---|
| #137 | Elephant Alpha none | Openrouter | 1 | 6.6 | 2/4 | 963ms |
| #138 | Ling-2.6-flash none | Inclusionai | 1 | 6.8 | 2/4 | 11.8s |
| #149 | Nemotron 3 Nano Omni 30b A3b Reasoning medium | NVIDIA | 1 | 6.4 | 2/4 | 1.20s |
| #156 | Hy3 preview none | Tencent | 1 | 4.8 | 1/4 | 11.1s |
| #161 | Qwen3.5-9B medium | Qwen | 1 | 5.1 | 1/4 | 34.4s |