नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

xAI: Grok 4.20 Beta vs Z.ai: GLM 5

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-12

मेट्रिक Grok 4.20 Beta Grok 4.20 Beta medium रिलीज़: 2026-03-12 GLM 5 GLM 5 none रिलीज़: 2026-02-12
रैंक #24 #33
औसत स्कोर 7.0 6.0
संगति 9.0 10.0
प्रति परिणाम लागत 5.989 0.200
कुल लागत $0.599 $0.018
सही परीक्षण
प्रति प्रयास पास दर 70.8% 56.3%
अस्थिर टेस्ट 2 0
कुल रन 48 48
आउटपुट टोकन 1,481 1,548
रीजनिंग टोकन 86,628 0
प्रतिक्रिया समय (औसत) 8.89s 4.03s
प्रतिक्रिया समय (अधिकतम) 24.21s 11.07s
प्रतिक्रिया समय (कुल) 142.18s 36.30s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

औसत स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.19s 262 6,289
GLM 5 4.0 10.0 33.3% 0 3.39s 272 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 227 12,212
GLM 5 10.0 10.0 0.0% 0 4.98s 406 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Beta 9.9 10.0 100.0% 0 4.01s 180 5,281
GLM 5 9.9 10.0 100.0% 0 5.78s 203 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Beta 4.0 10.0 33.3% 0 21.33s 251 40,255
GLM 5 10.0 10.0 0.0% 0 2.24s 19 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 72 3,440
GLM 5 10.0 10.0 100.0% 0 3.27s 103 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Beta 9.0 10.0 50.0% 0 4.97s 57 7,107
GLM 5 10.0 10.0 100.0% 0 1.48s 61 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.85s 249 6,660
GLM 5 7.0 10.0 66.7% 0 2.05s 264 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Beta 10.0 10.0 0.0% 0 12.39s 183 5,384
GLM 5 10.0 10.0 100.0% 0 11.07s 220 0

त्वरित तुलना

तुलना जोड़ी बदलें