Categoria AI BENCHY
Ranking de Truques anti-IA
Veja quais modelos de IA vão melhor em Truques anti-IA, quais permanecem confiáveis e onde aparecem as maiores diferenças.
Modelos exibidos
15
Média de Pontuação de Truques anti-IA
6.9
Melhor modelo
Gemini 3 Flash Preview 10.0| Posição | Modelo | Empresa | Pontuação de Truques anti-IA | Pontuação | Testes corretos | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|
| #30 | Qwen3.5-27B medium | Qwen | 8.7 | 7.8 | 3/4 | 19.8s |
| #57 | Step 3.7 Flash low | Stepfun | 8.7 | 7.3 | 3/4 | 4.02s |
| #86 | Grok 4.1 Fast medium | X AI | 8.7 | 6.5 | 3/4 | 3.81s |
| #100 | Grok Build 0.1 none | X AI | 8.7 | 6.0 | 3/4 | 6.30s |
| #119 | Cobuddy medium | Baidu | 8.7 | 5.6 | 3/4 | 10.00s |
| #53 | Gemini 3.1 Flash Lite high | 8.7 | 7.3 | 3/4 | 37.2s | |
| #45 | GPT-5.4 Mini medium | OpenAI | 8.6 | 7.5 | 3/4 | 4.05s |
| #28 | Gemini 2.5 Flash medium | 8.4 | 7.8 | 3/4 | 6.30s | |
| #8 | Claude Opus 4.7 none | Anthropic | 8.3 | 8.9 | 3/4 | 2.12s |
| #11 | Claude Opus 4.7 medium | Anthropic | 8.3 | 8.7 | 3/4 | 1.85s |
| #19 | Seed-2.0-Lite medium | Bytedance Seed | 8.3 | 8.2 | 3/4 | 18.0s |
| #21 | GPT-5.4 medium | OpenAI | 8.3 | 8.0 | 3/4 | 4.11s |
| #31 | DeepSeek V4 Flash high | DeepSeek | 8.3 | 7.7 | 3/4 | 28.5s |
| #47 | Grok Build 0.1 medium | X AI | 8.3 | 7.4 | 3/4 | 7.43s |
| #48 | Gemini 3 Flash Preview none | 8.3 | 7.4 | 3/4 | 1.25s |