Ranking de modelos de Trucos anti-IA

Categoría AI BENCHY

Mira qué modelos de IA rinden mejor en Trucos anti-IA, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Pruebas correctas ↓.

Modelos mostrados

Promedio de Puntuación de Trucos anti-IA

6.9

Mejor modelo

Gemini 3.5 Flash 10.0

Motivos de fallo

Con motivo de fallo Respuesta incorrecta250 Con motivo de fallo No siguió las instrucciones30 Con motivo de fallo Formato extra18 Con motivo de fallo Error de API12 Con motivo de fallo Tiempo agotado4 Con motivo de fallo Sin respuesta3

169/169

Rango	Modelo	Empresa	Puntuación de Trucos anti-IA	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#160	Grok Build 0.1 none	X AI	8.7	4.2	$0.547	3/4	6.30s
Pruebas totales 4 Pruebas incorrectas 1 Costo total $0.547 Tiempo de respuesta (promedio) 6.30s
#16	GPT-5 Mini medium	OpenAI	7.1	8.5	$0.159	2/4	13.9s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $0.159 Tiempo de respuesta (promedio) 13.9s
#22	GPT-5.2 medium	OpenAI	6.5	8.4	$0.548	2/4	7.81s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $0.548 Tiempo de respuesta (promedio) 7.81s
#31	Claude Sonnet 4.6 medium	Anthropic	6.5	7.8	$1.418	2/4	2.98s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $1.418 Tiempo de respuesta (promedio) 2.98s
#35	Kimi K2.6 medium	Moonshot AI	7.0	7.8	$0.889	2/4	11.6s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $0.889 Tiempo de respuesta (promedio) 11.6s
#38	Claude Opus 4.6 medium	Anthropic	6.4	7.7	$2.053	2/4	7.45s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $2.053 Tiempo de respuesta (promedio) 7.45s
#43	Kimi K2.5 medium	Moonshot AI	7.3	7.5	$0.348	2/4	51.4s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $0.348 Tiempo de respuesta (promedio) 51.4s
#44	Mercury 2 medium	Inception	6.9	7.5	$0.058	2/4	1.12s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $0.058 Tiempo de respuesta (promedio) 1.12s
#45	GPT-5.3 Chat none	OpenAI	6.7	7.5	$0.433	2/4	3.86s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $0.433 Tiempo de respuesta (promedio) 3.86s
#50	Seed-2.0-Mini medium	Bytedance Seed	6.6	7.4	$0.044	2/4	74.7s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $0.044 Tiempo de respuesta (promedio) 74.7s
#56	GLM 5V Turbo medium	Z.ai	7.2	7.3	$0.457	2/4	10.8s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $0.457 Tiempo de respuesta (promedio) 10.8s
#57	Claude Opus 4.8 none	Anthropic	6.5	7.2	$0.539	2/4	3.40s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $0.539 Tiempo de respuesta (promedio) 3.40s
#60	Qwen3.7 Plus none	Qwen	6.5	7.2	$0.023	2/4	1.38s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $0.023 Tiempo de respuesta (promedio) 1.38s
#65	Kimi K2.7 Code medium	Moonshot AI	7.3	7.0	$0.583	2/4	11.6s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $0.583 Tiempo de respuesta (promedio) 11.6s
#68	Qwen3.7 Max none	Qwen	6.5	6.9	$0.054	2/4	1.08s
Pruebas totales 4 Pruebas incorrectas 2 Costo total $0.054 Tiempo de respuesta (promedio) 1.08s

Ranking de Trucos anti-IA

Filtrar modelos

Mejores modelos por Puntuación de Trucos anti-IA

Puntuación de Trucos anti-IA vs costo total

Mejores modelos por Tiempo de respuesta (promedio)