#24

Grok 4.20 Beta

X AI · Rilis: 2026-03-12 · x-ai/grok-4.20-beta::medium

7.0

Biaya per hasil

5.989

Konsistensi

9.0

$0.599

Tes Salah: 6

Tingkat lulus per percobaan: 70.8%

Tes tidak stabil

2

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

8.89s

Waktu respons (maks): 24.21s

Waktu respons (total): 142.18s

Tidak mengikuti instruksi: 3 Jawaban salah: 3

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor Rata-rata vs Total Biaya

Waktu respons (rata-rata)

Skor Rata-rata vs Waktu respons (rata-rata)

Total token output

Skor Rata-rata vs Total token output

Perbandingan Cepat

Grok 4.20 BetamediumvsMiMo-V2-Flashmedium Grok 4.20 BetamediumvsGemini 3 Flash Previewnone Grok 4.20 BetamediumvsSeed-2.0-Minimedium Grok 4.20 BetamediumvsGPT-5.3 Chatnone Grok 4.20 BetamediumvsQwen3.5-Flashmedium Grok 4.20 BetamediumvsGemini 3 Flash Previewmedium Grok 4.20 BetamediumvsGemini 3.1 Pro Previewmedium Grok 4.20 BetamediumvsStep 3.5 FlashmediumTersedia gratis

Rincian Kategori

Kategori	Skor Rata-rata	Konsistensi	Tes benar
Trik anti-AI	7.0	7.2
Gabungan	10.0	10.0
Parsing dan ekstraksi data	9.9	10.0
Spesifik domain	4.0	10.0
Kecerdasan umum	10.0	10.0
Kepatuhan instruksi	9.0	10.0
Pemecahan teka-teki	7.0	7.2
Pemanggilan alat	10.0	10.0

Model yang Dibandingkan