Ranking de modelos de Seguimiento de instrucciones

Mira qué modelos de IA rinden mejor en Seguimiento de instrucciones, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↑.

Modelos mostrados

Promedio de Puntuación de Seguimiento de instrucciones

8.5

Mejor modelo

Granite 4.1 8B 3.6

Motivos de fallo

Con motivo de fallo Respuesta incorrecta61 Con motivo de fallo No siguió las instrucciones18 Con motivo de fallo Formato extra3 Con motivo de fallo Sin respuesta2 Con motivo de fallo Error de API1 Con motivo de fallo Tiempo agotado1

210/210

Rango	Modelo	Empresa	Puntuación de Seguimiento de instrucciones	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#154	MiMo-V2.5-Pro none	Xiaomi	6.4	5.5	$0.068	1/2	1.03s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.068 Tiempo de respuesta (promedio) 1.03s
#103	Qwen3.5-27B none	Qwen	6.3	6.5	$0.090	1/2	1.03s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.090 Tiempo de respuesta (promedio) 1.03s
#193	Elephant Alpha none	Openrouter	9.8	4.3	$0.000	2/2	1.03s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $0.000 Tiempo de respuesta (promedio) 1.03s
#116	Seed-2.0-Lite none	Bytedance Seed	10.0	6.2	$0.066	2/2	1.06s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $0.066 Tiempo de respuesta (promedio) 1.06s
#78	Mercury 2 medium	Inception	10.0	7.0	$0.093	2/2	1.07s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $0.093 Tiempo de respuesta (promedio) 1.07s
#139	GPT-5.4 none	OpenAI	6.5	5.8	$0.397	1/2	1.07s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.397 Tiempo de respuesta (promedio) 1.07s
#124	Qwen3.6 Flash none	Qwen	6.3	6.1	$0.062	1/2	1.10s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.062 Tiempo de respuesta (promedio) 1.10s
#174	GPT-4o-mini none	OpenAI	6.3	5.0	$0.010	1/2	1.11s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.010 Tiempo de respuesta (promedio) 1.11s
#106	Gemini 3.1 Flash Lite Preview none	Google	10.0	6.4	$0.052	2/2	1.13s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $0.052 Tiempo de respuesta (promedio) 1.13s
#132	GPT-5.6 Terra none	OpenAI	8.5	6.0	$0.349	1/2	1.15s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.349 Tiempo de respuesta (promedio) 1.15s
#87	GPT-5.5 none	OpenAI	6.2	6.9	$0.544	1/2	1.15s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.544 Tiempo de respuesta (promedio) 1.15s
#126	Qwen3.5 Plus 2026-04-20 none	Qwen	6.2	6.1	$0.122	1/2	1.17s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.122 Tiempo de respuesta (promedio) 1.17s
#159	GPT-5.6 Luna none	OpenAI	7.1	5.4	$0.142	1/2	1.23s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.142 Tiempo de respuesta (promedio) 1.23s
#83	GPT-5.6 Sol none	OpenAI	8.5	6.9	$0.524	1/2	1.33s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.524 Tiempo de respuesta (promedio) 1.33s
#66	Claude Opus 4.8 none	Anthropic	9.9	7.3	$1.166	2/2	1.37s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $1.166 Tiempo de respuesta (promedio) 1.37s

Ranking de Seguimiento de instrucciones

Filtrar modelos

Mejores modelos por Puntuación de Seguimiento de instrucciones

Puntuación de Seguimiento de instrucciones vs costo total

Mejores modelos por Tiempo de respuesta (promedio)