Ranking de Trucos anti-IA x Respuesta incorrecta

Mira qué modelos de IA tienen más probabilidades de caer en Respuesta incorrecta dentro de Trucos anti-IA, para detectar puntos débiles más rápido.

Modelos mostrados

Fallos totales

293

Modelo más afectado

Seed-2.0-Lite 4

Motivos de fallo

Respuesta incorrecta293 No siguió las instrucciones33 Formato extra20 Error de API14 Sin respuesta4 Tiempo agotado4

Categorías

Específico del dominio412 Trucos anti-IA293 Programación252 Resolución de acertijos201 Cultura general168 Combinado68 Seguimiento de instrucciones61 Inteligencia general59 Análisis y extracción de datos41 Llamada de herramientas3

140/140

Rango	Modelo	Empresa	Cantidad de Respuesta incorrecta	Puntuación de categoría	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#132	GPT-5.6 Terra none	OpenAI	3	4.8	$0.349	1/4	942ms
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.349 Tiempo de respuesta (promedio) 942ms
#138	Kimi K2.6 none	Moonshot AI	3	4.6	$0.184	1/4	1.39s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.184 Tiempo de respuesta (promedio) 1.39s
#141	GLM 5 none	Z.ai	3	4.8	$0.041	1/4	2.37s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.041 Tiempo de respuesta (promedio) 2.37s
#142	Qwen3.5-122B-A10B none	Qwen	3	4.8	$0.247	1/4	1.59s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.247 Tiempo de respuesta (promedio) 1.59s
#145	GLM 5V Turbo none	Z.ai	3	4.8	$0.052	1/4	3.13s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.052 Tiempo de respuesta (promedio) 3.13s
#146	Owl Alpha medium	Openrouter	3	4.8	$0.000	1/4	3.97s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.000 Tiempo de respuesta (promedio) 3.97s
#148	Owl Alpha none	Openrouter	3	3.4	$0.000	0/4	2.78s
Pruebas totales 4 Pruebas incorrectas 4 Costo total $0.000 Tiempo de respuesta (promedio) 2.78s
#154	MiMo-V2.5-Pro none	Xiaomi	3	3.3	$0.068	0/4	2.67s
Pruebas totales 4 Pruebas incorrectas 4 Costo total $0.068 Tiempo de respuesta (promedio) 2.67s
#157	Mimo V2 Omni none	Xiaomi	3	3.6	$0.021	0/4	1.63s
Pruebas totales 4 Pruebas incorrectas 4 Costo total $0.021 Tiempo de respuesta (promedio) 1.63s
#159	GPT-5.6 Luna none	OpenAI	3	4.8	$0.142	1/4	901ms
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.142 Tiempo de respuesta (promedio) 901ms
#164	Inkling none	Thinkingmachines	3	4.8	$0.147	1/4	1.43s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.147 Tiempo de respuesta (promedio) 1.43s
#167	Mistral Small 4 medium	Mistral	3	5.6	$0.096	1/4	2.67s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.096 Tiempo de respuesta (promedio) 2.67s
#174	GPT-4o-mini none	OpenAI	3	4.8	$0.010	1/4	1.34s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.010 Tiempo de respuesta (promedio) 1.34s
#176	GLM 4.7 Flash none	Z.ai	3	5.2	$0.016	1/4	5.51s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.016 Tiempo de respuesta (promedio) 5.51s
#177	Nemotron 3 Super none	NVIDIA	3	4.8	$0.008	1/4	4.46s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.008 Tiempo de respuesta (promedio) 4.46s

Filtrar modelos

Mejores modelos por Cantidad de Respuesta incorrecta

Cantidad de Respuesta incorrecta vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado

Trucos anti-IA: Respuesta incorrecta

Filtrar modelos

Mejores modelos por Cantidad de Respuesta incorrecta

Cantidad de Respuesta incorrecta vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado