Eșecuri pe categorii AI BENCHY
Specific domeniului: Fără răspuns
Specific domeniului
Fără răspuns
Vezi ce modele AI au cele mai mari șanse să întâmpine Fără răspuns la Specific domeniului, ca să găsești mai repede punctele slabe. Sortează după: Număr de eșecuri ↑.
Motive de eșec
| Rang | Model | Companie | Număr de Fără răspuns | Scor de categorie | Teste corecte | Timp de răspuns (mediu) |
|---|---|---|---|---|---|---|
| #71 | Step 3.7 Flash high | Stepfun | 1 | 4.1 | 0/3 | 149.6s |
| #80 | Mimo V2 Omni medium | Xiaomi | 1 | 3.0 | 0/3 | 47.9s |
| #107 | Laguna Xs.2 medium | Poolside | 1 | 4.1 | 0/3 | 11.1s |
| #149 | Nemotron 3 Nano Omni 30b A3b Reasoning medium | NVIDIA | 1 | 2.9 | 0/3 | 56.7s |
| #158 | GLM 4.7 Flash medium | Z.ai | 1 | 3.5 | 0/3 | 174.6s |