Ranking de modelos de Trucos anti-IA

Categoría AI BENCHY

Mira qué modelos de IA rinden mejor en Trucos anti-IA, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Pruebas correctas ↓.

Modelos mostrados

Promedio de Puntuación de Trucos anti-IA

6.9

Mejor modelo

Gemini 3.5 Flash 10.0

Motivos de fallo

Con motivo de fallo Respuesta incorrecta250 Con motivo de fallo No siguió las instrucciones30 Con motivo de fallo Formato extra18 Con motivo de fallo Error de API12 Con motivo de fallo Tiempo agotado4 Con motivo de fallo Sin respuesta3

169/169

Rango	Modelo	Empresa	Puntuación de Trucos anti-IA	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#26	Nemotron 3 Ultra 550b A55b medium	NVIDIA	10.0	8.1	$0.158	4/4	8.62s
Pruebas totales 4 Pruebas incorrectas 0 Costo total $0.158 Tiempo de respuesta (promedio) 8.62s
#30	Qwen3.6 Plus medium	Qwen	10.0	7.8	$0.294	4/4	9.90s
Pruebas totales 4 Pruebas incorrectas 0 Costo total $0.294 Tiempo de respuesta (promedio) 9.90s
#33	Qwen3.5 Plus 2026-04-20 medium	Qwen	10.0	7.8	$0.317	4/4	10.8s
Pruebas totales 4 Pruebas incorrectas 0 Costo total $0.317 Tiempo de respuesta (promedio) 10.8s
#36	Qwen3.5-122B-A10B medium	Qwen	10.0	7.7	$0.588	4/4	9.75s
Pruebas totales 4 Pruebas incorrectas 0 Costo total $0.588 Tiempo de respuesta (promedio) 9.75s
#37	Grok 4.3 medium	X AI	10.0	7.7	$0.614	4/4	8.83s
Pruebas totales 4 Pruebas incorrectas 0 Costo total $0.614 Tiempo de respuesta (promedio) 8.83s
#47	Qwen3.6 Flash medium	Qwen	10.0	7.5	$0.288	4/4	6.10s
Pruebas totales 4 Pruebas incorrectas 0 Costo total $0.288 Tiempo de respuesta (promedio) 6.10s
#51	MiMo-V2.5-Pro medium	Xiaomi	10.0	7.4	$0.106	4/4	3.26s
Pruebas totales 4 Pruebas incorrectas 0 Costo total $0.106 Tiempo de respuesta (promedio) 3.26s
#52	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.111	4/4	3.48s
Pruebas totales 4 Pruebas incorrectas 0 Costo total $0.111 Tiempo de respuesta (promedio) 3.48s
#54	Hy3 preview medium	Tencent	10.0	7.3	$0.021	4/4	6.59s
Pruebas totales 4 Pruebas incorrectas 0 Costo total $0.021 Tiempo de respuesta (promedio) 6.59s
#59	Gemma 4 26B A4B medium	Google	10.0	7.2	$0.045	4/4	6.20s
Pruebas totales 4 Pruebas incorrectas 0 Costo total $0.045 Tiempo de respuesta (promedio) 6.20s
#63	Step 3.7 Flash high	Stepfun	10.0	7.1	$1.148	4/4	13.4s
Pruebas totales 4 Pruebas incorrectas 0 Costo total $1.148 Tiempo de respuesta (promedio) 13.4s
#64	GLM 5.1 medium	Z.ai	10.0	7.1	$0.292	4/4	8.31s
Pruebas totales 4 Pruebas incorrectas 0 Costo total $0.292 Tiempo de respuesta (promedio) 8.31s
#66	Gemini 3.5 Flash none	Google	10.0	7.0	$1.079	4/4	2.53s
Pruebas totales 4 Pruebas incorrectas 0 Costo total $1.079 Tiempo de respuesta (promedio) 2.53s
#70	Qwen3.5-Flash medium	Qwen	10.0	6.8	$0.080	4/4	59.1s
Pruebas totales 4 Pruebas incorrectas 0 Costo total $0.080 Tiempo de respuesta (promedio) 59.1s
#72	Ring-2.6-1T medium	Inclusionai	10.0	6.8	$0.033	4/4	42.2s
Pruebas totales 4 Pruebas incorrectas 0 Costo total $0.033 Tiempo de respuesta (promedio) 42.2s

Ranking de Trucos anti-IA

Filtrar modelos

Mejores modelos por Puntuación de Trucos anti-IA

Puntuación de Trucos anti-IA vs costo total

Mejores modelos por Tiempo de respuesta (promedio)