Ranking de modelos de Seguimiento de instrucciones

Mira qué modelos de IA rinden mejor en Seguimiento de instrucciones, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↓.

Modelos mostrados

Promedio de Puntuación de Seguimiento de instrucciones

8.6

Mejor modelo

Kimi K2.5 10.0

Motivos de fallo

Con motivo de fallo Respuesta incorrecta61 Con motivo de fallo No siguió las instrucciones19 Con motivo de fallo Formato extra3 Con motivo de fallo Sin respuesta2 Con motivo de fallo Error de API1 Con motivo de fallo Tiempo agotado1

216/216

Rango	Modelo	Empresa	Puntuación de Seguimiento de instrucciones	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#58	GPT-5.3 Chat none	OpenAI	9.8	7.5	$0.571	2/2	3.51s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $0.571 Tiempo de respuesta (promedio) 3.51s
#181	Qwen3.6 Plus Preview medium	Qwen	6.5	4.9	$0.000	1/2	3.40s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.000 Tiempo de respuesta (promedio) 3.40s
#83	Gemini 3.5 Flash none	Google	9.8	7.0	$1.079	2/2	3.38s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $1.079 Tiempo de respuesta (promedio) 3.38s
#13	GPT-5.5 medium	OpenAI	10.0	9.0	$4.137	2/2	3.36s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $4.137 Tiempo de respuesta (promedio) 3.36s
#115	Mimo V2 PRO medium	Xiaomi	9.9	6.3	$0.333	2/2	3.36s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $0.333 Tiempo de respuesta (promedio) 3.36s
#4	Gemini 3.5 Flash high	Google	10.0	9.5	$1.976	2/2	3.35s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $1.976 Tiempo de respuesta (promedio) 3.35s
#17	Claude Opus 4.8 medium	Anthropic	10.0	8.8	$1.931	2/2	3.32s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $1.931 Tiempo de respuesta (promedio) 3.32s
#139	Gemini 3 PRO Preview medium	Google	9.8	6.0	$0.385	2/2	3.26s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $0.385 Tiempo de respuesta (promedio) 3.26s
#24	GPT-5.2 medium	OpenAI	9.9	8.4	$0.951	2/2	3.12s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $0.951 Tiempo de respuesta (promedio) 3.12s
#21	GPT-5.4 medium	OpenAI	10.0	8.5	$1.533	2/2	3.11s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $1.533 Tiempo de respuesta (promedio) 3.11s
#26	Claude Sonnet 5 medium	Anthropic	9.9	8.3	$0.922	2/2	3.10s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $0.922 Tiempo de respuesta (promedio) 3.10s
#16	GPT-5.3-Codex medium	OpenAI	10.0	8.9	$0.920	2/2	3.04s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $0.920 Tiempo de respuesta (promedio) 3.04s
#200	GLM 4.7 Flash medium	Z.ai	6.2	4.3	$0.166	1/2	2.97s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.166 Tiempo de respuesta (promedio) 2.97s
#121	Gemma 4 31B none	Google	6.5	6.2	$0.021	1/2	2.84s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.021 Tiempo de respuesta (promedio) 2.84s
#202	Hunter Alpha none	OpenRouter	6.4	4.2	$0.000	1/2	2.82s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.000 Tiempo de respuesta (promedio) 2.82s

Ranking de Seguimiento de instrucciones

Filtrar modelos

Mejores modelos por Puntuación de Seguimiento de instrucciones

Puntuación de Seguimiento de instrucciones vs costo total

Mejores modelos por Tiempo de respuesta (promedio)