Categoría AI BENCHY
Ranking de Seguimiento de instrucciones
Mira qué modelos de IA rinden mejor en Seguimiento de instrucciones, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Costo total ↑.
Modelos mostrados
4
Promedio de Puntuación de Seguimiento de instrucciones
8.5
Mejor modelo
North Mini Code 9.8
169/169
Filtrar modelos
Ningún modelo coincide con la búsqueda y los filtros actuales.
| Rango | Modelo | Empresa | Puntuación de Seguimiento de instrucciones | Puntuación | Costo total | Pruebas correctas | Tiempo de respuesta (promedio) |
|---|---|---|---|---|---|---|---|
| #95 | Gemini 3.1 Flash Lite Preview high | 9.8 | 6.1 | $2.310 | 2/2 | 64.0s | |
| #6 | Claude Fable 5 medium | Anthropic | 10.0 | 9.2 | $3.165 | 2/2 | 5.90s |
| #9 | GPT-5.5 medium | OpenAI | 10.0 | 9.0 | $3.679 | 2/2 | 3.36s |
| #136 | Grok 4.20 Multi Agent Beta medium | X AI | 9.8 | 5.0 | $5.599 | 2/2 | 3.52s |