Eșecuri AI BENCHY
Eșecuri Timp expirat
Vezi ce modele AI se lovesc cel mai des de Timp expirat, ca să identifici riscurile de fiabilitate înainte să alegi. Sortează după: Teste corecte ↓.
| Rang | Model | Companie | Număr de Timp expirat | Scor | Teste corecte | Timp de răspuns (mediu) |
|---|---|---|---|---|---|---|
| #130 | MiniMax M2.7 medium | Minimax | 2 | 5.3 | 5/21 | 38.2s |
| #150 | Qwen3 Coder Next medium | Qwen | 1 | 4.6 | 4/21 | 8.58s |
| #158 | GLM 4.7 Flash medium | Z.ai | 2 | 4.4 | 4/21 | 35.1s |
| #161 | Qwen3.5-9B medium | Qwen | 11 | 4.2 | 3/21 | 82.2s |