#47
X AI · प्रकाशन: 2026-03-12 · x-ai/grok-4.20-multi-agent-beta::medium
अस्थिर चाचण्या
6
अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).
चार्ट्स
पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.
सरासरी स्कोअर vs एकूण खर्च
प्रतिसाद वेळ (सरासरी)
सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)
एकूण आउटपुट टोकन्स
सरासरी स्कोअर vs एकूण आउटपुट टोकन्स
झटपट तुलना
Grok 4.20 Multi-Agent BetamediumvsSeed-2.0-LitenoneGrok 4.20 Multi-Agent BetamediumvsQwen3.5-122B-A10BnoneGrok 4.20 Multi-Agent BetamediumvsQwen3.5-35B-A3BnoneGrok 4.20 Multi-Agent Betamediumvsgpt-oss-120bmediumमोफत उपलब्धGrok 4.20 Multi-Agent BetamediumvsMiniMax M2.5mediumGrok 4.20 Multi-Agent BetamediumvsGemini 3 Flash PreviewmediumGrok 4.20 Multi-Agent BetamediumvsGemini 3.1 Pro PreviewmediumGrok 4.20 Multi-Agent BetamediumvsStep 3.5 Flashmediumमोफत उपलब्ध
श्रेणीवार तपशील
| श्रेणी | सरासरी स्कोअर | सुसंगतता | बरोबर चाचण्या |
|---|---|---|---|
| अँटी-एआय युक्त्या | 4.0 | 4.4 | |
| संयुक्त | 10.0 | 10.0 | |
| डेटा पार्सिंग आणि निष्कर्षण | 9.9 | 10.0 | |
| डोमेन-विशिष्ट | 10.0 | 7.2 | |
| Samanya Buddhimatta | 4.0 | 2.8 | |
| सूचनांचे पालन | 9.0 | 10.0 | |
| कोडी सोडवणे | 6.3 | 5.1 | |
| टूल कॉलिंग | 10.0 | 10.0 |