#47

Grok 4.20 Multi-Agent Beta

X AI · प्रकाशन: 2026-03-12 · x-ai/grok-4.20-multi-agent-beta::medium

सरासरी स्कोअर

4.9

प्रति निकाल खर्च

97.178

सुसंगतता

7.1

एकूण खर्च

$4.859

बरोबर चाचण्या

चुकीच्या चाचण्या: 11

प्रति प्रयत्न पास दर: 52.1%

अस्थिर चाचण्या

6

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

9.08s

प्रतिसाद वेळ (कमाल): 35.28s

प्रतिसाद वेळ (एकूण): 127.09s

सूचनांचे पालन केले नाही: 4 चुकीचे उत्तर: 3 API त्रुटी: 2 अतिरिक्त फॉरमॅटिंग: 2

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

स्कोअरनुसार शीर्ष मॉडेल्स

सरासरी स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

सरासरी स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Grok 4.20 Multi-Agent BetamediumvsSeed-2.0-Litenone Grok 4.20 Multi-Agent BetamediumvsQwen3.5-122B-A10Bnone Grok 4.20 Multi-Agent BetamediumvsQwen3.5-35B-A3Bnone Grok 4.20 Multi-Agent Betamediumvsgpt-oss-120bmediumमोफत उपलब्ध Grok 4.20 Multi-Agent BetamediumvsMiniMax M2.5medium Grok 4.20 Multi-Agent BetamediumvsGemini 3 Flash Previewmedium Grok 4.20 Multi-Agent BetamediumvsGemini 3.1 Pro Previewmedium Grok 4.20 Multi-Agent BetamediumvsStep 3.5 Flashmediumमोफत उपलब्ध

श्रेणीवार तपशील

श्रेणी	सरासरी स्कोअर	सुसंगतता	बरोबर चाचण्या
अँटी-एआय युक्त्या	4.0	4.4
संयुक्त	10.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	9.9	10.0
डोमेन-विशिष्ट	10.0	7.2
Samanya Buddhimatta	4.0	2.8
सूचनांचे पालन	9.0	10.0
कोडी सोडवणे	6.3	5.1
टूल कॉलिंग	10.0	10.0

तुलना केलेली मॉडेल्स