नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

xAI: Grok 4.20 Beta vs Z.ai: GLM 5

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-12

मेट्रिक Grok 4.20 Beta Grok 4.20 Beta medium प्रकाशन: 2026-03-12 GLM 5 GLM 5 none प्रकाशन: 2026-02-12
क्रमांक #24 #33
सरासरी स्कोअर 7.0 6.0
सुसंगतता 9.0 10.0
प्रति निकाल खर्च 5.989 0.200
एकूण खर्च $0.599 $0.018
बरोबर चाचण्या
प्रति प्रयत्न पास दर 70.8% 56.3%
अस्थिर चाचण्या 2 0
एकूण रन 48 48
आउटपुट टोकन्स 1,481 1,548
रिझनिंग टोकन्स 86,628 0
प्रतिसाद वेळ (सरासरी) 8.89s 4.03s
प्रतिसाद वेळ (कमाल) 24.21s 11.07s
प्रतिसाद वेळ (एकूण) 142.18s 36.30s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

सरासरी स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.19s 262 6,289
GLM 5 4.0 10.0 33.3% 0 3.39s 272 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 227 12,212
GLM 5 10.0 10.0 0.0% 0 4.98s 406 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 9.9 10.0 100.0% 0 4.01s 180 5,281
GLM 5 9.9 10.0 100.0% 0 5.78s 203 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 4.0 10.0 33.3% 0 21.33s 251 40,255
GLM 5 10.0 10.0 0.0% 0 2.24s 19 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 72 3,440
GLM 5 10.0 10.0 100.0% 0 3.27s 103 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 9.0 10.0 50.0% 0 4.97s 57 7,107
GLM 5 10.0 10.0 100.0% 0 1.48s 61 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.85s 249 6,660
GLM 5 7.0 10.0 66.7% 0 2.05s 264 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 10.0 10.0 0.0% 0 12.39s 183 5,384
GLM 5 10.0 10.0 100.0% 0 11.07s 220 0

झटपट तुलना

तुलना जोडी बदला