#47
X AI · रिलीज़: 2026-03-12 · x-ai/grok-4.20-multi-agent-beta::medium
अस्थिर टेस्ट
6
अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।
चार्ट
पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।
औसत स्कोर vs कुल लागत
प्रतिक्रिया समय (औसत)
औसत स्कोर vs प्रतिक्रिया समय (औसत)
कुल आउटपुट टोकन
औसत स्कोर vs कुल आउटपुट टोकन
त्वरित तुलना
Grok 4.20 Multi-Agent BetamediumvsSeed-2.0-LitenoneGrok 4.20 Multi-Agent BetamediumvsQwen3.5-122B-A10BnoneGrok 4.20 Multi-Agent BetamediumvsQwen3.5-35B-A3BnoneGrok 4.20 Multi-Agent Betamediumvsgpt-oss-120bmediumनिःशुल्क उपलब्धGrok 4.20 Multi-Agent BetamediumvsMiniMax M2.5mediumGrok 4.20 Multi-Agent BetamediumvsGemini 3 Flash PreviewmediumGrok 4.20 Multi-Agent BetamediumvsGemini 3.1 Pro PreviewmediumGrok 4.20 Multi-Agent BetamediumvsStep 3.5 Flashmediumनिःशुल्क उपलब्ध
श्रेणी विवरण
| श्रेणी | औसत स्कोर | संगति | सही परीक्षण |
|---|---|---|---|
| एंटी-एआई ट्रिक्स | 4.0 | 4.4 | |
| संयुक्त | 10.0 | 10.0 | |
| डेटा पार्सिंग और निष्कर्षण | 9.9 | 10.0 | |
| डोमेन-विशिष्ट | 10.0 | 7.2 | |
| Samanya Buddhimatta | 4.0 | 2.8 | |
| निर्देश पालन | 9.0 | 10.0 | |
| पहेली समाधान | 6.3 | 5.1 | |
| टूल कॉलिंग | 10.0 | 10.0 |