#47

Grok 4.20 Multi-Agent Beta

X AI · Lançamento: 2026-03-12 · x-ai/grok-4.20-multi-agent-beta::medium

Pontuação média

4.9

Custo por resultado

97.178

Consistência

7.1

$4.859

Testes corretos

Testes errados: 11

Taxa de acerto por tentativa: 52.1%

Testes instáveis

6

Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).

Tempo de resposta (médio)

9.08s

Tempo de resposta (máx.): 35.28s

Tempo de resposta (total): 127.09s

Não seguiu as instruções: 4 Resposta incorreta: 3 Erro de API: 2 Formatação extra: 2

Gráficos

Escolha o primeiro modelo e depois clique em um segundo modelo para abrir uma página lado a lado.

Melhores modelos por pontuação

Pontuação média vs Custo total

Tempo de resposta (médio)

Pontuação média vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação média vs Total de tokens de saída

Comparação rápida

Grok 4.20 Multi-Agent BetamediumvsSeed-2.0-Litenone Grok 4.20 Multi-Agent BetamediumvsQwen3.5-122B-A10Bnone Grok 4.20 Multi-Agent BetamediumvsQwen3.5-35B-A3Bnone Grok 4.20 Multi-Agent Betamediumvsgpt-oss-120bmediumDisponível grátis Grok 4.20 Multi-Agent BetamediumvsMiniMax M2.5medium Grok 4.20 Multi-Agent BetamediumvsGemini 3 Flash Previewmedium Grok 4.20 Multi-Agent BetamediumvsGemini 3.1 Pro Previewmedium Grok 4.20 Multi-Agent BetamediumvsStep 3.5 FlashmediumDisponível grátis

Detalhamento por categoria

Categoria	Pontuação média	Consistência	Testes corretos
Truques anti-IA	4.0	4.4
Combinado	10.0	10.0
Análise e extração de dados	9.9	10.0
Específico do domínio	10.0	7.2
Inteligência geral	4.0	2.8
Seguimento de instruções	9.0	10.0
Resolução de quebra-cabeças	6.3	5.1
Chamada de ferramentas	10.0	10.0

Modelos comparados