#47

Grok 4.20 Multi-Agent Beta

X AI · Lansare: 2026-03-12 · x-ai/grok-4.20-multi-agent-beta::medium

4.9

Cost per rezultat

97.178

Consistență

7.1

$4.859

Teste greșite: 11

Rată de trecere pe încercare: 52.1%

Teste instabile

6

Testele instabile au avut rezultate mixte între rulări (cel puțin un succes și un eșec).

Timp de răspuns (mediu)

9.08s

Timp de răspuns (maxim): 35.28s

Timp de răspuns (total): 127.09s

Nu a urmat instrucțiunile: 4 Răspuns greșit: 3 Eroare API: 2 Formatare suplimentară: 2

Grafice

Alege primul model, apoi fă clic pe al doilea model pentru a deschide o pagină alăturată.

Top modele după scor

Scor mediu vs Cost total

Timp de răspuns (mediu)

Scor mediu vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor mediu vs Total tokenuri de ieșire

Comparație rapidă

Grok 4.20 Multi-Agent BetamediumvsSeed-2.0-Litenone Grok 4.20 Multi-Agent BetamediumvsQwen3.5-122B-A10Bnone Grok 4.20 Multi-Agent BetamediumvsQwen3.5-35B-A3Bnone Grok 4.20 Multi-Agent Betamediumvsgpt-oss-120bmediumDisponibil gratuit Grok 4.20 Multi-Agent BetamediumvsMiniMax M2.5medium Grok 4.20 Multi-Agent BetamediumvsGemini 3 Flash Previewmedium Grok 4.20 Multi-Agent BetamediumvsGemini 3.1 Pro Previewmedium Grok 4.20 Multi-Agent BetamediumvsStep 3.5 FlashmediumDisponibil gratuit

Defalcare pe categorii

Categorie	Scor mediu	Consistență	Teste corecte
Trucuri anti-AI	4.0	4.4
Combinat	10.0	10.0
Parsare și extragere de date	9.9	10.0
Specific domeniului	10.0	7.2
Inteligență generală	4.0	2.8
Respectarea instrucțiunilor	9.0	10.0
Rezolvare de puzzle-uri	6.3	5.1
Apelare instrumente	10.0	10.0

Modele comparate