AI BENCHY
Advertise here

Categoría AI BENCHY

Ranking de Seguimiento de instrucciones

Mira qué modelos de IA rinden mejor en Seguimiento de instrucciones, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↓.

Modelos mostrados

15

Promedio de Puntuación de Seguimiento de instrucciones

8.5

Mejor modelo

Kimi K2.5 10.0
Rango Modelo Empresa Puntuación de Seguimiento de instrucciones Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#132 Mistral Small 4 medium Mistral 7.3 5.3 1/2 1.38s
#149 Nemotron 3 Nano Omni 30b A3b Reasoning medium NVIDIA 7.3 4.6 1/2 1.37s
#68 Claude Opus 4.8 none Anthropic 9.9 7.0 2/2 1.37s
#114 Qwen3.5 Plus 2026-04-20 none Qwen 6.2 5.7 1/2 1.17s
#91 GPT-5.5 none OpenAI 6.2 6.4 1/2 1.15s
#58 Gemini 3.1 Flash Lite Preview none Google 10.0 7.2 2/2 1.13s
#147 GPT-4o-mini none OpenAI 6.3 4.8 1/2 1.11s
#128 Qwen3.6 Flash none Qwen 6.3 5.4 1/2 1.10s
#125 GPT-5.4 none OpenAI 6.5 5.5 1/2 1.07s
#81 Mercury 2 medium Inception 10.0 6.6 2/2 1.07s
#110 Seed-2.0-Lite none Bytedance Seed 10.0 5.8 2/2 1.06s
#137 Elephant Alpha none Openrouter 9.8 5.1 2/2 1.03s
#115 Qwen3.5-27B none Qwen 6.3 5.7 1/2 1.03s
#123 MiMo-V2.5-Pro none Xiaomi 6.4 5.5 1/2 1.03s
#136 Elephant Alpha medium Openrouter 9.8 5.1 2/2 987ms

Mejores modelos por Puntuación de Seguimiento de instrucciones

Puntuación de Seguimiento de instrucciones vs costo total

Mejores modelos por Tiempo de respuesta (promedio)