#24

Grok 4.20 Beta

X AI · रिलीज़: 2026-03-12 · x-ai/grok-4.20-beta::medium

औसत स्कोर

7.0

प्रति परिणाम लागत

5.989

संगति

9.0

कुल लागत

$0.599

सही परीक्षण

गलत टेस्ट: 6

प्रति प्रयास पास दर: 70.8%

अस्थिर टेस्ट

2

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

8.89s

प्रतिक्रिया समय (अधिकतम): 24.21s

प्रतिक्रिया समय (कुल): 142.18s

निर्देशों का पालन नहीं किया: 3 गलत उत्तर: 3

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

स्कोर के अनुसार शीर्ष मॉडल

औसत स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

औसत स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Grok 4.20 BetamediumvsMiMo-V2-Flashmedium Grok 4.20 BetamediumvsGemini 3 Flash Previewnone Grok 4.20 BetamediumvsSeed-2.0-Minimedium Grok 4.20 BetamediumvsGPT-5.3 Chatnone Grok 4.20 BetamediumvsQwen3.5-Flashmedium Grok 4.20 BetamediumvsGemini 3 Flash Previewmedium Grok 4.20 BetamediumvsGemini 3.1 Pro Previewmedium Grok 4.20 BetamediumvsStep 3.5 Flashmediumनिःशुल्क उपलब्ध

श्रेणी विवरण

श्रेणी	औसत स्कोर	संगति	सही परीक्षण
एंटी-एआई ट्रिक्स	7.0	7.2
संयुक्त	10.0	10.0
डेटा पार्सिंग और निष्कर्षण	9.9	10.0
डोमेन-विशिष्ट	4.0	10.0
Samanya Buddhimatta	10.0	10.0
निर्देश पालन	9.0	10.0
पहेली समाधान	7.0	7.2
टूल कॉलिंग	10.0	10.0

तुलना किए गए मॉडल