Fallos por categoría de AI BENCHY
Específico del dominio: Sin respuesta
Específico del dominio
Sin respuesta
Mira qué modelos de IA tienen más probabilidades de caer en Sin respuesta dentro de Específico del dominio, para detectar puntos débiles más rápido. Ordenar por: Tiempo de respuesta (promedio) ↑.
Motivos de fallo
| Rango | Modelo | Empresa | Cantidad de Sin respuesta | Puntuación de categoría | Pruebas correctas | Tiempo de respuesta (promedio) |
|---|---|---|---|---|---|---|
| #107 | Laguna Xs.2 medium | Poolside | 1 | 4.1 | 0/3 | 11.1s |
| #80 | Mimo V2 Omni medium | Xiaomi | 1 | 3.0 | 0/3 | 47.9s |
| #149 | Nemotron 3 Nano Omni 30b A3b Reasoning medium | NVIDIA | 1 | 2.9 | 0/3 | 56.7s |
| #71 | Step 3.7 Flash high | Stepfun | 1 | 4.1 | 0/3 | 149.6s |
| #158 | GLM 4.7 Flash medium | Z.ai | 1 | 3.5 | 0/3 | 174.6s |