#24

Grok 4.20 Beta

X AI · Lansare: 2026-03-12 · x-ai/grok-4.20-beta::medium

7.0

Cost per rezultat

5.989

Consistență

9.0

$0.599

Teste greșite: 6

Rată de trecere pe încercare: 70.8%

Teste instabile

2

Testele instabile au avut rezultate mixte între rulări (cel puțin un succes și un eșec).

Timp de răspuns (mediu)

8.89s

Timp de răspuns (maxim): 24.21s

Timp de răspuns (total): 142.18s

Nu a urmat instrucțiunile: 3 Răspuns greșit: 3

Grafice

Alege primul model, apoi fă clic pe al doilea model pentru a deschide o pagină alăturată.

Top modele după scor

Scor mediu vs Cost total

Timp de răspuns (mediu)

Scor mediu vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor mediu vs Total tokenuri de ieșire

Comparație rapidă

Grok 4.20 BetamediumvsMiMo-V2-Flashmedium Grok 4.20 BetamediumvsGemini 3 Flash Previewnone Grok 4.20 BetamediumvsSeed-2.0-Minimedium Grok 4.20 BetamediumvsGPT-5.3 Chatnone Grok 4.20 BetamediumvsQwen3.5-Flashmedium Grok 4.20 BetamediumvsGemini 3 Flash Previewmedium Grok 4.20 BetamediumvsGemini 3.1 Pro Previewmedium Grok 4.20 BetamediumvsStep 3.5 FlashmediumDisponibil gratuit

Defalcare pe categorii

Categorie	Scor mediu	Consistență	Teste corecte
Trucuri anti-AI	7.0	7.2
Combinat	10.0	10.0
Parsare și extragere de date	9.9	10.0
Specific domeniului	4.0	10.0
Inteligență generală	10.0	10.0
Respectarea instrucțiunilor	9.0	10.0
Rezolvare de puzzle-uri	7.0	7.2
Apelare instrumente	10.0	10.0

Modele comparate