#24

Grok 4.20 Beta

X AI · Release: 2026-03-12 · x-ai/grok-4.20-beta::medium

7.0

Cost per result

5.989

Consistency

9.0

$0.599

Wrong Tests: 6

Attempt pass rate: 70.8%

Flaky tests

2

Flaky tests had mixed outcomes across runs (at least one pass and one fail).

Response Time (avg)

8.89s

Response Time (max): 24.21s

Response Time (total): 142.18s

Did not follow instructions: 3 Wrong answer: 3

Charts

Choose the first model, then click a second model to open a side-by-side page.

Top Models by Score

Avg Score vs Total Cost

Response Time (avg)

Avg Score vs Response Time (avg)

Total Output Tokens

Avg Score vs Total Output Tokens

Quick Compare

Grok 4.20 BetamediumvsMiMo-V2-Flashmedium Grok 4.20 BetamediumvsGemini 3 Flash Previewnone Grok 4.20 BetamediumvsSeed-2.0-Minimedium Grok 4.20 BetamediumvsGPT-5.3 Chatnone Grok 4.20 BetamediumvsQwen3.5-Flashmedium Grok 4.20 BetamediumvsGemini 3 Flash Previewmedium Grok 4.20 BetamediumvsGemini 3.1 Pro Previewmedium Grok 4.20 BetamediumvsStep 3.5 FlashmediumFree Available

Category Breakdown

Category	Avg Score	Consistency	Tests Correct
Anti-AI Tricks	7.0	7.2
Combined	10.0	10.0
Data parsing and extraction	9.9	10.0
Domain specific	4.0	10.0
General Intelligence	10.0	10.0
Instructions following	9.0	10.0
Puzzle Solving	7.0	7.2
Tool Calling	10.0	10.0

Compared models