Fallos por categoría de AI BENCHY
Seguimiento de instrucciones: Formato extra
Seguimiento de instrucciones
Formato extra
Mira qué modelos de IA tienen más probabilidades de caer en Formato extra dentro de Seguimiento de instrucciones, para detectar puntos débiles más rápido.
Motivos de fallo
2/2
Filtrar modelos
Ningún modelo coincide con la búsqueda y los filtros actuales.
| Rango | Modelo | Empresa | Cantidad de Formato extra | Puntuación de categoría | Costo total | Pruebas correctas | Tiempo de respuesta (promedio) |
|---|---|---|---|---|---|---|---|
| #117 | DeepSeek V4 Flash none | DeepSeek | 1 | 6.5 | $0.007 | 1/2 | 17.5s |
| #158 | Hy3 preview none | Tencent | 1 | 6.3 | $0.003 | 1/2 | 13.0s |