#40

Grok 4.20

X AI · रिलीज़: 2026-03-31 · x-ai/grok-4.20::medium

पहचान नोट

Grok 4.20 Beta, Grok 4.20 का प्रीव्यू संस्करण था।

स्कोर

7.1

संगति

8.2

कुल लागत

$0.663

कुल आउटपुट टोकन

98,572

???? ???

$2.000 / 1M

????? ???

$6.000 / 1M

सही परीक्षण

गलत टेस्ट: 8

प्रति प्रयास पास दर: 66.7%

अस्थिर टेस्ट

4

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

9.50s

प्रतिक्रिया समय (अधिकतम): 29.87s

प्रतिक्रिया समय (कुल): 161.54s

निर्देशों का पालन नहीं किया: 4 गलत उत्तर: 2 API त्रुटि: 1 अतिरिक्त फॉर्मेटिंग: 1

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Grok 4.20mediumvsQwen3.5-35B-A3Bmedium Grok 4.20mediumvsKimi K2.5medium Grok 4.20mediumvsGPT-5.2medium Grok 4.20mediumvsSeed-2.0-Minimedium Grok 4.20mediumvsGPT-5.4 Minimedium Grok 4.20mediumvsGemini 3 Flash Previewmedium Grok 4.20mediumvsGemini 3.1 Pro Previewmedium Grok 4.20mediumvsQwen3.6 Plusmediumनिःशुल्क उपलब्ध

श्रेणी विवरण

श्रेणी	स्कोर	संगति	सही परीक्षण
एंटी-एआई ट्रिक्स	8.2	7.9
संयुक्त	10.0	10.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	5.8	2.8
निर्देश पालन	7.3	5.9
पहेली समाधान	6.4	7.7
टूल कॉलिंग	3.0	10.0

तुलना किए गए मॉडल