#47

Grok 4.20 Multi-Agent Beta

X AI · Rilis: 2026-03-12 · x-ai/grok-4.20-multi-agent-beta::medium

4.9

Biaya per hasil

97.178

Konsistensi

7.1

$4.859

Tes Salah: 11

Tingkat lulus per percobaan: 52.1%

Tes tidak stabil

6

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

9.08s

Waktu respons (maks): 35.28s

Waktu respons (total): 127.09s

Tidak mengikuti instruksi: 4 Jawaban salah: 3 Kesalahan API: 2 Format tambahan: 2

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor Rata-rata vs Total Biaya

Waktu respons (rata-rata)

Skor Rata-rata vs Waktu respons (rata-rata)

Total token output

Skor Rata-rata vs Total token output

Perbandingan Cepat

Grok 4.20 Multi-Agent BetamediumvsSeed-2.0-Litenone Grok 4.20 Multi-Agent BetamediumvsQwen3.5-122B-A10Bnone Grok 4.20 Multi-Agent BetamediumvsQwen3.5-35B-A3Bnone Grok 4.20 Multi-Agent Betamediumvsgpt-oss-120bmediumTersedia gratis Grok 4.20 Multi-Agent BetamediumvsMiniMax M2.5medium Grok 4.20 Multi-Agent BetamediumvsGemini 3 Flash Previewmedium Grok 4.20 Multi-Agent BetamediumvsGemini 3.1 Pro Previewmedium Grok 4.20 Multi-Agent BetamediumvsStep 3.5 FlashmediumTersedia gratis

Rincian Kategori

Kategori	Skor Rata-rata	Konsistensi	Tes benar
Trik anti-AI	4.0	4.4
Gabungan	10.0	10.0
Parsing dan ekstraksi data	9.9	10.0
Spesifik domain	10.0	7.2
Kecerdasan umum	4.0	2.8
Kepatuhan instruksi	9.0	10.0
Pemecahan teka-teki	6.3	5.1
Pemanggilan alat	10.0	10.0

Model yang Dibandingkan