AI BENCHY
Comparar Gráficos Metodología
❤️ Made by XCS
Your ad here

Fallos por categoría de AI BENCHY

Trucos anti-IA
Formato extra

Mira qué modelos de IA tienen más probabilidades de caer en Formato extra dentro de Trucos anti-IA, para detectar puntos débiles más rápido. Ordenar por: Tiempo de respuesta (promedio) ↓.

Modelos mostrados

5

Fallos totales

8

Modelo más afectado

Claude Opus 4.6 2
Rango Modelo Empresa Cantidad de Formato extra Puntuación de categoría Pruebas correctas Tiempo de respuesta (promedio)
#26 Claude Opus 4.6 medium Anthropic 2 4.0 1/3 11.9s
#33 DeepSeek V3.2 none DeepSeek 2 10.0 0/3 8.79s
#11 Claude Sonnet 4.6 medium Anthropic 1 7.0 2/3 4.95s
#25 Claude Sonnet 4.6 none Anthropic 2 4.0 1/3 4.83s
#48 Qwen3 Coder Next none Qwen 1 2.3 0/3 4.39s

Mejores modelos por Cantidad de Formato extra

Cantidad de Formato extra vs puntuación promedio

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado