AI BENCHY
Your ad here

Categoría AI BENCHY

Ranking de Seguimiento de instrucciones

Mira qué modelos de IA rinden mejor en Seguimiento de instrucciones, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↓.

Modelos mostrados

15

Promedio de Puntuación de Seguimiento de instrucciones

8.0

Mejor modelo

Kimi K2.5 10.0
Rango Modelo Empresa Puntuación de Seguimiento de instrucciones Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#18 GLM 5 Turbo medium Z.ai 10.0 8.1 2/2 5.38s
#52 Grok 4.1 Fast medium X AI 6.6 6.7 1/2 5.30s
#84 gpt-oss-120b none OpenAI 8.4 5.2 1/2 5.10s
#30 Step 3.5 Flash medium Stepfun 8.5 7.9 1/2 4.98s
#25 Grok 4.20 Beta medium X AI 8.3 8.0 1/2 4.97s
#35 MiMo-V2-Omni medium Xiaomi 8.3 7.7 1/2 4.92s
#71 MiniMax M2.5 medium Minimax 8.1 5.7 1/2 4.64s
#56 Grok 4.20 Multi Agent Beta medium X AI 8.3 6.4 1/2 4.63s
#47 Grok 4.20 medium X AI 7.3 7.0 1/2 4.42s
#41 MiMo-V2-Flash medium Xiaomi 10.0 7.5 2/2 4.28s
#55 MiMo-V2-Omni none Xiaomi 6.5 6.5 1/2 4.18s
#50 Hunter Alpha medium OpenRouter 9.9 6.7 2/2 4.18s
#31 GLM 5V Turbo medium Z.ai 9.9 7.8 2/2 3.74s
#23 MiMo-V2-Pro medium Xiaomi 9.9 8.1 2/2 3.36s
#36 GPT-5.3 Chat none OpenAI 8.3 7.7 1/2 3.29s

Mejores modelos por Puntuación de Seguimiento de instrucciones

Puntuación de Seguimiento de instrucciones vs costo total

Mejores modelos por Tiempo de respuesta (promedio)