Ranking de Truques anti-IA x Resposta incorreta

Veja quais modelos de IA têm mais chance de encontrar Resposta incorreta em Truques anti-IA, para identificar pontos fracos mais rápido.

Modelos exibidos

Falhas totais

306

Modelo mais afetado

Seed-2.0-Lite 4

Motivos de falha

Resposta incorreta306 Não seguiu as instruções33 Formatação extra20 Erro de API15 Sem resposta6 Tempo esgotado4

Categorias

Específico do domínio433 Truques anti-IA306 Programação266 Resolução de quebra-cabeças214 Conhecimentos gerais176 Combinado71 Inteligência geral66 Seguimento de instruções65 Análise e extração de dados41 Chamada de ferramentas4

144/144

Posição	Modelo	Empresa	Contagem de Resposta incorreta	Pontuação da categoria	Custo total	Testes corretos	Tempo de resposta (médio)
#34	GPT-5.2 Chat none	OpenAI	1	8.7	$0.604	3/4	3.40s
Total de testes 4 Testes errados 1 Custo total $0.604 Tempo de resposta (médio) 3.40s
#38	GPT-5.6 Terra high	OpenAI	1	8.3	$1.055	3/4	2.54s
Total de testes 4 Testes errados 1 Custo total $1.055 Tempo de resposta (médio) 2.54s
#39	Seed-2.0-Lite medium	Bytedance Seed	1	8.3	$0.234	3/4	18.0s
Total de testes 4 Testes errados 1 Custo total $0.234 Tempo de resposta (médio) 18.0s
#43	GPT-5.6 Terra medium	OpenAI	1	8.3	$0.676	3/4	2.22s
Total de testes 4 Testes errados 1 Custo total $0.676 Tempo de resposta (médio) 2.22s
#44	Claude Sonnet 4.6 medium	Anthropic	1	6.5	$2.057	2/4	2.98s
Total de testes 4 Testes errados 2 Custo total $2.057 Tempo de resposta (médio) 2.98s
#48	GPT-5.6 Luna high	OpenAI	1	8.3	$1.017	3/4	2.99s
Total de testes 4 Testes errados 1 Custo total $1.017 Tempo de resposta (médio) 2.99s
#49	DeepSeek V4 Flash high	DeepSeek	1	8.3	$0.042	3/4	28.5s
Total de testes 4 Testes errados 1 Custo total $0.042 Tempo de resposta (médio) 28.5s
#54	GPT-5.6 Luna medium	OpenAI	1	8.3	$0.352	3/4	2.52s
Total de testes 4 Testes errados 1 Custo total $0.352 Tempo de resposta (médio) 2.52s
#57	GPT-5.4 Nano medium	OpenAI	1	8.3	$0.138	3/4	4.52s
Total de testes 4 Testes errados 1 Custo total $0.138 Tempo de resposta (médio) 4.52s
#58	GPT-5.3 Chat none	OpenAI	1	6.7	$0.571	2/4	3.86s
Total de testes 4 Testes errados 2 Custo total $0.571 Tempo de resposta (médio) 3.86s
#59	GPT-5.6 Terra low	OpenAI	1	8.3	$0.519	3/4	2.36s
Total de testes 4 Testes errados 1 Custo total $0.519 Tempo de resposta (médio) 2.36s
#60	GPT-5.4 Mini medium	OpenAI	1	8.6	$0.756	3/4	4.05s
Total de testes 4 Testes errados 1 Custo total $0.756 Tempo de resposta (médio) 4.05s
#61	Qwen3.5 Plus 2026-02-15 medium	Qwen	1	8.2	$0.437	3/4	45.8s
Total de testes 4 Testes errados 1 Custo total $0.437 Tempo de resposta (médio) 45.8s
#67	Claude Sonnet 4.6 none	Anthropic	1	4.8	$0.661	1/4	2.94s
Total de testes 4 Testes errados 3 Custo total $0.661 Tempo de resposta (médio) 2.94s
#71	Step 3.7 Flash low	Stepfun	1	8.7	$0.454	3/4	4.02s
Total de testes 4 Testes errados 1 Custo total $0.454 Tempo de resposta (médio) 4.02s

Filtrar modelos

Melhores modelos por Contagem de Resposta incorreta

Contagem de Resposta incorreta vs Pontuação

Melhores modelos por Tempo de resposta (médio)

Melhores modelos por Custo desperdiçado estimado

Truques anti-IA: Resposta incorreta

Filtrar modelos

Melhores modelos por Contagem de Resposta incorreta

Contagem de Resposta incorreta vs Pontuação

Melhores modelos por Tempo de resposta (médio)

Melhores modelos por Custo desperdiçado estimado