Ranking de modelos de Trucos anti-IA

Categoría AI BENCHY

Mira qué modelos de IA rinden mejor en Trucos anti-IA, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Pruebas correctas ↓.

Modelos mostrados

Promedio de Puntuación de Trucos anti-IA

6.9

Mejor modelo

Gemini 3.5 Flash 10.0

Motivos de fallo

Con motivo de fallo Respuesta incorrecta250 Con motivo de fallo No siguió las instrucciones30 Con motivo de fallo Formato extra18 Con motivo de fallo Error de API12 Con motivo de fallo Tiempo agotado4 Con motivo de fallo Sin respuesta3

169/169

Rango	Modelo	Empresa	Puntuación de Trucos anti-IA	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#152	Elephant Alpha none	Openrouter	6.6	4.6	$0.000	2/4	963ms
Pruebas totales 4 Pruebas incorrectas 2 Costo total $0.000 Tiempo de respuesta (promedio) 963ms
#153	Elephant Alpha medium	Openrouter	6.6	4.5	$0.000	2/4	1.19s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $0.000 Tiempo de respuesta (promedio) 1.19s
#156	Laguna Xs.2 medium	Poolside	6.9	4.3	$0.000	2/4	2.68s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $0.000 Tiempo de respuesta (promedio) 2.68s
#164	gpt-oss-120b none	OpenAI	6.5	4.0	$0.010	2/4	32.8s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $0.010 Tiempo de respuesta (promedio) 32.8s
#166	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	6.4	3.6	$0.000	2/4	1.20s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $0.000 Tiempo de respuesta (promedio) 1.20s
#40	MiniMax M3 medium	Minimax	5.5	7.6	$0.131	1/4	14.9s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.131 Tiempo de respuesta (promedio) 14.9s
#41	DeepSeek V4 Pro high	DeepSeek	5.7	7.6	$0.157	1/4	25.7s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.157 Tiempo de respuesta (promedio) 25.7s
#55	Claude Sonnet 4.6 none	Anthropic	4.8	7.3	$0.316	1/4	2.94s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.316 Tiempo de respuesta (promedio) 2.94s
#100	Qwen3.6 Max Preview none	Qwen	5.2	6.0	$0.075	1/4	2.63s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.075 Tiempo de respuesta (promedio) 2.63s
#101	GLM 5 none	Z.ai	4.8	6.0	$0.027	1/4	2.37s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.027 Tiempo de respuesta (promedio) 2.37s
#104	Qwen3.5-27B none	Qwen	4.8	5.9	$0.015	1/4	788ms
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.015 Tiempo de respuesta (promedio) 788ms
#105	GLM 5V Turbo none	Z.ai	4.8	5.9	$0.052	1/4	3.13s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.052 Tiempo de respuesta (promedio) 3.13s
#106	Qwen3.5 Plus 2026-02-15 none	Qwen	4.8	5.8	$0.016	1/4	1.91s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.016 Tiempo de respuesta (promedio) 1.91s
#108	Owl Alpha medium	Openrouter	4.8	5.8	$0.000	1/4	3.97s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.000 Tiempo de respuesta (promedio) 3.97s
#111	Kimi K2.6 none	Moonshot AI	4.6	5.8	$0.079	1/4	1.39s
Pruebas totales 4 Pruebas incorrectas 3 Costo total $0.079 Tiempo de respuesta (promedio) 1.39s

Ranking de Trucos anti-IA

Filtrar modelos

Mejores modelos por Puntuación de Trucos anti-IA

Puntuación de Trucos anti-IA vs costo total

Mejores modelos por Tiempo de respuesta (promedio)