AI BENCHY
Your ad here

Categoría AI BENCHY

Ranking de Seguimiento de instrucciones

Mira qué modelos de IA rinden mejor en Seguimiento de instrucciones, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Pruebas correctas ↓.

Modelos mostrados

10

Promedio de Puntuación de Seguimiento de instrucciones

8.1

Rango Modelo Empresa Puntuación de Seguimiento de instrucciones Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#93 Grok 4.20 Beta none X AI 4.8 5.3 0/2 687ms
#94 MiniMax M2.7 medium Minimax 3.7 5.3 0/2 12.6s
#96 Grok 4.20 none X AI 4.8 5.2 0/2 455ms
#101 Qwen3 Coder Next none Qwen 4.8 5.1 0/2 7.71s
#103 Nemotron 3 Super none NVIDIA 4.9 5.1 0/2 1.50s
#104 GPT-4o-mini none OpenAI 4.8 4.9 0/2 1.27s
#107 Qwen3 Coder Next medium Qwen 4.8 4.7 0/2 7.34s
#111 Grok 4.1 Fast none X AI 3.0 4.5 0/2 923ms
#113 GPT-5.4 Nano none OpenAI 5.0 4.5 0/2 787ms
#115 LFM2-24B-A2B none Liquid 4.8 4.1 0/2 1.09s

Mejores modelos por Puntuación de Seguimiento de instrucciones

Puntuación de Seguimiento de instrucciones vs costo total

Mejores modelos por Tiempo de respuesta (promedio)