AI BENCHY
Advertise here

Categoría AI BENCHY

Ranking de Seguimiento de instrucciones

Mira qué modelos de IA rinden mejor en Seguimiento de instrucciones, cuáles se mantienen fiables y dónde aparecen las mayores diferencias.

Modelos mostrados

15

Promedio de Puntuación de Seguimiento de instrucciones

8.5

Rango Modelo Empresa Puntuación de Seguimiento de instrucciones Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#149 Nemotron 3 Nano Omni 30b A3b Reasoning medium NVIDIA 7.3 4.6 1/2 1.37s
#77 Claude Sonnet 4.6 none Anthropic 6.5 6.8 1/2 1.96s
#85 Gemma 4 31B none Google 6.5 6.5 1/2 2.84s
#86 Grok 4.1 Fast medium X AI 6.5 6.5 1/2 4.63s
#93 Qwen3.6 Plus Preview medium Qwen 6.5 6.3 1/2 3.40s
#101 Mimo V2 Omni none Xiaomi 6.5 6.0 1/2 4.26s
#109 GLM 5V Turbo none Z.ai 6.5 5.8 1/2 1.97s
#111 Owl Alpha medium Openrouter 6.5 5.7 1/2 10.2s
#120 Mimo V2 PRO none Xiaomi 6.5 5.6 1/2 2.51s
#122 GLM 4.7 Flash none Z.ai 6.5 5.5 1/2 888ms
#124 Kimi K2.6 none Moonshot AI 6.5 5.5 1/2 1.64s
#125 GPT-5.4 none OpenAI 6.5 5.5 1/2 1.07s
#134 GLM 5 Turbo none Z.ai 6.5 5.2 1/2 2.13s
#135 Kimi K2.5 none Moonshot AI 6.5 5.2 1/2 2.67s
#139 DeepSeek V4 Flash none DeepSeek 6.5 5.0 1/2 17.5s

Mejores modelos por Puntuación de Seguimiento de instrucciones

Puntuación de Seguimiento de instrucciones vs costo total

Mejores modelos por Tiempo de respuesta (promedio)