AI BENCHY
Advertise here

Categoría AI BENCHY

Ranking de Seguimiento de instrucciones

Mira qué modelos de IA rinden mejor en Seguimiento de instrucciones, cuáles se mantienen fiables y dónde aparecen las mayores diferencias.

Modelos mostrados

15

Promedio de Puntuación de Seguimiento de instrucciones

8.5

Rango Modelo Empresa Puntuación de Seguimiento de instrucciones Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#1 Gemini 3 Flash Preview medium Google 10.0 9.8 2/2 4.04s
#2 Gemini 3.5 Flash high Google 10.0 9.6 2/2 3.35s
#4 Gemini 3.1 Pro Preview medium Google 10.0 9.4 2/2 9.56s
#5 Qwen3.7 Max medium Qwen 10.0 9.1 2/2 7.46s
#8 Claude Opus 4.7 none Anthropic 10.0 8.9 2/2 1.46s
#9 GPT-5.5 medium OpenAI 10.0 8.8 2/2 3.36s
#10 Claude Opus 4.8 medium Anthropic 10.0 8.7 2/2 3.32s
#11 Claude Opus 4.7 medium Anthropic 10.0 8.7 2/2 1.57s
#14 Qwen3.6 Max Preview medium Qwen 10.0 8.5 2/2 24.3s
#15 GPT-5.3-Codex medium OpenAI 10.0 8.4 2/2 3.04s
#17 GLM 5 medium Z.ai 10.0 8.3 2/2 7.25s
#18 Qwen3.7 Plus medium Qwen 10.0 8.2 2/2 16.1s
#19 Seed-2.0-Lite medium Bytedance Seed 10.0 8.2 2/2 7.26s
#21 GPT-5.4 medium OpenAI 10.0 8.0 2/2 3.11s
#23 GLM 5 Turbo medium Z.ai 10.0 8.0 2/2 5.38s

Mejores modelos por Puntuación de Seguimiento de instrucciones

Puntuación de Seguimiento de instrucciones vs costo total

Mejores modelos por Tiempo de respuesta (promedio)