Fallos por categoría de AI BENCHY
Específico del dominio: Sin respuesta
Específico del dominio
Sin respuesta
Mira qué modelos de IA tienen más probabilidades de caer en Sin respuesta dentro de Específico del dominio, para detectar puntos débiles más rápido. Ordenar por: Pruebas correctas ↑.
Motivos de fallo
| Rango | Modelo | Empresa | Cantidad de Sin respuesta | Puntuación de categoría | Pruebas correctas | Tiempo de respuesta (promedio) |
|---|---|---|---|---|---|---|
| #71 | Step 3.7 Flash high | Stepfun | 1 | 4.1 | 0/3 | 149.6s |
| #80 | Mimo V2 Omni medium | Xiaomi | 1 | 3.0 | 0/3 | 47.9s |
| #107 | Laguna Xs.2 medium | Poolside | 1 | 4.1 | 0/3 | 11.1s |
| #149 | Nemotron 3 Nano Omni 30b A3b Reasoning medium | NVIDIA | 1 | 2.9 | 0/3 | 56.7s |
| #158 | GLM 4.7 Flash medium | Z.ai | 1 | 3.5 | 0/3 | 174.6s |