#47

Grok 4.20 Multi-Agent Beta

X AI · Lanzamiento: 2026-03-12 · x-ai/grok-4.20-multi-agent-beta::medium

4.9

Costo por resultado

97.178

Consistencia

7.1

$4.859

Pruebas correctas

Pruebas incorrectas: 11

Tasa de aciertos por intento: 52.1%

Pruebas inestables

6

Pruebas inestables tuvieron resultados mixtos entre ejecuciones (al menos un acierto y un fallo).

Tiempo de respuesta (promedio)

9.08s

Tiempo de respuesta (máximo): 35.28s

Tiempo de respuesta (total): 127.09s

No siguió las instrucciones: 4 Respuesta incorrecta: 3 Error de API: 2 Formato extra: 2

Gráficos

Elige el primer modelo y luego haz clic en un segundo modelo para abrir una página lado a lado.

Mejores modelos por puntuación

Puntaje prom. vs Costo total

Tiempo de respuesta (promedio)

Puntaje prom. vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntaje prom. vs Total de tokens de salida

Comparación rápida

Grok 4.20 Multi-Agent BetamediumvsSeed-2.0-Litenone Grok 4.20 Multi-Agent BetamediumvsQwen3.5-122B-A10Bnone Grok 4.20 Multi-Agent BetamediumvsQwen3.5-35B-A3Bnone Grok 4.20 Multi-Agent Betamediumvsgpt-oss-120bmediumDisponible gratis Grok 4.20 Multi-Agent BetamediumvsMiniMax M2.5medium Grok 4.20 Multi-Agent BetamediumvsGemini 3 Flash Previewmedium Grok 4.20 Multi-Agent BetamediumvsGemini 3.1 Pro Previewmedium Grok 4.20 Multi-Agent BetamediumvsStep 3.5 FlashmediumDisponible gratis

Desglose por categoría

Categoría	Puntaje prom.	Consistencia	Pruebas correctas
Trucos anti-IA	4.0	4.4
Combinado	10.0	10.0
Análisis y extracción de datos	9.9	10.0
Específico del dominio	10.0	7.2
Inteligencia general	4.0	2.8
Seguimiento de instrucciones	9.0	10.0
Resolución de acertijos	6.3	5.1
Llamada de herramientas	10.0	10.0

Modelos comparados