Ranking de Trucos anti-IA x Formato extra

Mira qué modelos de IA tienen más probabilidades de caer en Formato extra dentro de Trucos anti-IA, para detectar puntos débiles más rápido.

Modelos mostrados

Fallos totales

Modelo más afectado

Claude Opus 4.6 2

Motivos de fallo

Respuesta incorrecta293 No siguió las instrucciones33 Formato extra20 Error de API14 Sin respuesta4 Tiempo agotado4

Categorías

Trucos anti-IA20 Programación18 Específico del dominio17 Resolución de acertijos8 Análisis y extracción de datos6 Seguimiento de instrucciones3 Combinado1

14/14

Rango	Modelo	Empresa	Cantidad de Formato extra	Puntuación de categoría	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#43	Claude Opus 4.6 medium	Anthropic	2	6.4	$3.059	2/4	7.45s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $3.059 Tiempo de respuesta (promedio) 7.45s
#63	Claude Sonnet 4.6 none	Anthropic	2	4.8	$0.661	1/4	2.94s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.661 Tiempo de respuesta (promedio) 2.94s
#66	Claude Opus 4.8 none	Anthropic	2	6.5	$1.166	2/4	3.40s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $1.166 Tiempo de respuesta (promedio) 3.40s
#112	Claude Sonnet 5 none	Anthropic	2	5.3	$0.548	1/4	3.60s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.548 Tiempo de respuesta (promedio) 3.60s
#171	North Mini Code none	Cohere	2	3.0	$0.000	0/4	22.5s
Pruebas totales 4 Pruebas incorrectas 4 Costo total $0.000 Tiempo de respuesta (promedio) 22.5s
#173	DeepSeek V3.2 none	DeepSeek	2	3.2	$0.054	0/4	9.35s
Pruebas totales 4 Pruebas incorrectas 4 Costo total $0.054 Tiempo de respuesta (promedio) 9.35s
#40	Claude Sonnet 4.6 medium	Anthropic	1	6.5	$2.057	2/4	2.98s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $2.057 Tiempo de respuesta (promedio) 2.98s
#48	Grok Build 0.1 medium	X AI	1	8.3	$1.097	3/4	7.43s
Pruebas totales 4 Pruebas incorrectas 1 Costo total $1.097 Tiempo de respuesta (promedio) 7.43s
#58	Qwen3.5-27B medium	Qwen	1	8.7	$1.627	3/4	19.8s
Pruebas totales 4 Pruebas incorrectas 1 Costo total $1.627 Tiempo de respuesta (promedio) 19.8s
#82	DeepSeek V4 Pro none	DeepSeek	1	3.2	$0.096	0/4	4.02s
Pruebas totales 4 Pruebas incorrectas 4 Costo total $0.096 Tiempo de respuesta (promedio) 4.02s
#113	MiMo-V2-Flash medium	Xiaomi	1	8.1	$0.043	3/4	15.8s
Pruebas totales 4 Pruebas incorrectas 1 Costo total $0.043 Tiempo de respuesta (promedio) 15.8s
#137	North Mini Code medium	Cohere	1	8.4	$0.000	3/4	64.8s
Pruebas totales 4 Pruebas incorrectas 1 Costo total $0.000 Tiempo de respuesta (promedio) 64.8s
#166	Qwen3 Coder Next none	Qwen	1	3.6	$0.025	0/4	3.31s
Pruebas totales 4 Pruebas incorrectas 4 Costo total $0.025 Tiempo de respuesta (promedio) 3.31s
#181	Grok 4.20 Multi Agent Beta medium	X AI	1	6.9	$5.599	2/4	3.46s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $5.599 Tiempo de respuesta (promedio) 3.46s

Filtrar modelos

Mejores modelos por Cantidad de Formato extra

Cantidad de Formato extra vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado

Trucos anti-IA: Formato extra

Filtrar modelos

Mejores modelos por Cantidad de Formato extra

Cantidad de Formato extra vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado