AI BENCHY
Comparar Gráficos Metodologia
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Falhas por categoria AI BENCHY

Truques anti-IA
Formatação extra

Veja quais modelos de IA têm mais chance de encontrar Formatação extra em Truques anti-IA, para identificar pontos fracos mais rápido. Ordenar por: Testes corretos ↑.

Modelos exibidos

5

Falhas totais

8

Modelo mais afetado

DeepSeek V3.2 2
Posição Modelo Empresa Contagem de Formatação extra Pontuação da categoria Testes corretos Tempo de resposta (médio)
#33 DeepSeek V3.2 none DeepSeek 2 10.0 0/3 8.79s
#48 Qwen3 Coder Next none Qwen 1 2.3 0/3 4.39s
#25 Claude Sonnet 4.6 none Anthropic 2 4.0 1/3 4.83s
#26 Claude Opus 4.6 medium Anthropic 2 4.0 1/3 11.9s
#11 Claude Sonnet 4.6 medium Anthropic 1 7.0 2/3 4.95s

Melhores modelos por Contagem de Formatação extra

Contagem de Formatação extra vs pontuação média

Melhores modelos por Tempo de resposta (médio)

Melhores modelos por Custo desperdiçado estimado