नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

xAI: Grok 4.20 Multi-Agent Beta vs Z.ai: GLM 4.7 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-12

मेट्रिक Grok 4.20 Multi-Agent Beta Grok 4.20 Multi-Agent Beta medium रिलीज़: 2026-03-12 GLM 4.7 Flash GLM 4.7 Flash none रिलीज़: 2026-01-19
रैंक #47 #57
औसत स्कोर 4.9 3.9
संगति 7.1 8.4
प्रति परिणाम लागत 97.178 0.066
कुल लागत $4.859 $0.003
सही परीक्षण
प्रति प्रयास पास दर 52.1% 35.4%
अस्थिर टेस्ट 6 3
कुल रन 48 48
आउटपुट टोकन 293,634 1,855
रीजनिंग टोकन 291,260 0
प्रतिक्रिया समय (औसत) 9.08s 2.99s
प्रतिक्रिया समय (अधिकतम) 35.28s 7.05s
प्रतिक्रिया समय (कुल) 127.09s 26.90s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

औसत स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Multi-Agent Beta 4.0 4.4 66.7% 2 3.77s 28,392 27,808
GLM 4.7 Flash 10.0 7.2 22.2% 1 6.59s 430 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Multi-Agent Beta 10.0 10.0 0.0% 0 0ms 0 0
GLM 4.7 Flash 10.0 10.0 0.0% 0 3.22s 704 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Multi-Agent Beta 9.9 10.0 100.0% 0 5.54s 25,306 25,051
GLM 4.7 Flash 5.4 5.8 83.3% 1 4.82s 196 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Multi-Agent Beta 10.0 7.2 11.1% 1 24.67s 164,609 163,647
GLM 4.7 Flash 7.0 10.0 66.7% 0 744ms 19 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Multi-Agent Beta 4.0 2.8 66.7% 1 6.40s 15,848 15,746
GLM 4.7 Flash 3.0 10.0 0.0% 0 1.59s 134 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Multi-Agent Beta 9.0 10.0 50.0% 0 4.63s 25,457 25,322
GLM 4.7 Flash 5.5 10.0 50.0% 0 888ms 62 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Multi-Agent Beta 6.3 5.1 77.8% 2 5.01s 34,022 33,686
GLM 4.7 Flash 3.7 10.0 0.0% 0 1.00s 98 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Multi-Agent Beta 10.0 10.0 0.0% 0 0ms 0 0
GLM 4.7 Flash 10.0 1.6 33.3% 1 7.05s 212 0

त्वरित तुलना

तुलना जोड़ी बदलें