Fallos por categoría de AI BENCHY
Seguimiento de instrucciones: Error de API
Seguimiento de instrucciones
Error de API
Mira qué modelos de IA tienen más probabilidades de caer en Error de API dentro de Seguimiento de instrucciones, para detectar puntos débiles más rápido.
Motivos de fallo
| Rango | Modelo | Empresa | Cantidad de Error de API | Puntuación de categoría | Pruebas correctas | Tiempo de respuesta (promedio) |
|---|---|---|---|---|---|---|
| #47 | Grok 4.20 medium | X AI | 1 | 7.3 | 1/2 | 4.42s |