Ranking de modelos de Truques anti-IA

Veja quais modelos de IA vão melhor em Truques anti-IA, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Métrica ↑.

Modelos exibidos

Média de Pontuação de Truques anti-IA

7.2

Melhor modelo

LFM2-24B-A2B 2.5

Motivos de falha

Com motivo de falha Resposta incorreta293 Com motivo de falha Não seguiu as instruções33 Com motivo de falha Formatação extra20 Com motivo de falha Erro de API14 Com motivo de falha Sem resposta4 Com motivo de falha Tempo esgotado4

216/216

Posição	Modelo	Empresa	Pontuação de Truques anti-IA	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#138	GPT-5.6 Terra none	OpenAI	4.8	6.0	$0.349	1/4	942ms
Total de testes 4 Testes errados 3 Custo total $0.349 Tempo de resposta (médio) 942ms
#147	GLM 5 none	Z.ai	4.8	5.7	$0.041	1/4	2.37s
Total de testes 4 Testes errados 3 Custo total $0.041 Tempo de resposta (médio) 2.37s
#148	Qwen3.5-122B-A10B none	Qwen	4.8	5.7	$0.247	1/4	1.59s
Total de testes 4 Testes errados 3 Custo total $0.247 Tempo de resposta (médio) 1.59s
#151	GLM 5V Turbo none	Z.ai	4.8	5.6	$0.052	1/4	3.13s
Total de testes 4 Testes errados 3 Custo total $0.052 Tempo de resposta (médio) 3.13s
#152	Owl Alpha medium	Openrouter	4.8	5.6	$0.000	1/4	3.97s
Total de testes 4 Testes errados 3 Custo total $0.000 Tempo de resposta (médio) 3.97s
#165	GPT-5.6 Luna none	OpenAI	4.8	5.4	$0.142	1/4	901ms
Total de testes 4 Testes errados 3 Custo total $0.142 Tempo de resposta (médio) 901ms
#170	Inkling none	Thinkingmachines	4.8	5.2	$0.147	1/4	1.43s
Total de testes 4 Testes errados 3 Custo total $0.147 Tempo de resposta (médio) 1.43s
#180	GPT-4o-mini none	OpenAI	4.8	5.0	$0.010	1/4	1.34s
Total de testes 4 Testes errados 3 Custo total $0.010 Tempo de resposta (médio) 1.34s
#203	Grok 4.20 none	X AI	4.8	4.1	$0.057	1/4	501ms
Total de testes 4 Testes errados 3 Custo total $0.057 Tempo de resposta (médio) 501ms
#205	Hy3 preview none	Tencent	4.8	4.0	$0.003	1/4	11.1s
Total de testes 4 Testes errados 3 Custo total $0.003 Tempo de resposta (médio) 11.1s
#214	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	4.8	3.2	$0.000	1/4	584ms
Total de testes 4 Testes errados 3 Custo total $0.000 Tempo de resposta (médio) 584ms
#183	Nemotron 3 Super none	NVIDIA	4.8	4.9	$0.008	1/4	4.46s
Total de testes 4 Testes errados 3 Custo total $0.008 Tempo de resposta (médio) 4.46s
#207	Granite 4.1 8B none	IBM Granite	4.9	4.0	$0.007	1/4	844ms
Total de testes 4 Testes errados 3 Custo total $0.007 Tempo de resposta (médio) 844ms
#210	Qwen3.5-9B medium	Qwen	5.1	3.8	$0.036	1/4	34.4s
Total de testes 4 Testes errados 3 Custo total $0.036 Tempo de resposta (médio) 34.4s
#103	Qwen3.6 Max Preview none	Qwen	5.2	6.6	$0.231	1/4	2.63s
Total de testes 4 Testes errados 3 Custo total $0.231 Tempo de resposta (médio) 2.63s

Ranking de Truques anti-IA

Filtrar modelos

Melhores modelos por Pontuação de Truques anti-IA

Pontuação de Truques anti-IA vs custo total

Melhores modelos por Tempo de resposta (médio)