#47
X AI · Lançamento: 2026-03-12 · x-ai/grok-4.20-multi-agent-beta::medium
Testes instáveis
6
Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).
Gráficos
Escolha o primeiro modelo e depois clique em um segundo modelo para abrir uma página lado a lado.
Pontuação média vs Custo total
Tempo de resposta (médio)
Pontuação média vs Tempo de resposta (médio)
Total de tokens de saída
Pontuação média vs Total de tokens de saída
Comparação rápida
Grok 4.20 Multi-Agent BetamediumvsSeed-2.0-LitenoneGrok 4.20 Multi-Agent BetamediumvsQwen3.5-122B-A10BnoneGrok 4.20 Multi-Agent BetamediumvsQwen3.5-35B-A3BnoneGrok 4.20 Multi-Agent Betamediumvsgpt-oss-120bmediumDisponível grátisGrok 4.20 Multi-Agent BetamediumvsMiniMax M2.5mediumGrok 4.20 Multi-Agent BetamediumvsGemini 3 Flash PreviewmediumGrok 4.20 Multi-Agent BetamediumvsGemini 3.1 Pro PreviewmediumGrok 4.20 Multi-Agent BetamediumvsStep 3.5 FlashmediumDisponível grátis
Detalhamento por categoria
| Categoria | Pontuação média | Consistência | Testes corretos |
|---|---|---|---|
| Truques anti-IA | 4.0 | 4.4 | |
| Combinado | 10.0 | 10.0 | |
| Análise e extração de dados | 9.9 | 10.0 | |
| Específico do domínio | 10.0 | 7.2 | |
| Inteligência geral | 4.0 | 2.8 | |
| Seguimento de instruções | 9.0 | 10.0 | |
| Resolução de quebra-cabeças | 6.3 | 5.1 | |
| Chamada de ferramentas | 10.0 | 10.0 |