नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

xAI: Grok 4.20 Beta vs Z.ai: GLM 5 Turbo

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-15

मेट्रिक Grok 4.20 Beta Grok 4.20 Beta none प्रकाशन: 2026-03-12 GLM 5 Turbo GLM 5 Turbo none प्रकाशन: 2026-03-15
क्रमांक #54 #53
स्कोअर 5.5 5.7
सुसंगतता 9.1 9.5
प्रति निकाल खर्च 2.214 0.467
एकूण खर्च $0.089 $0.028
बरोबर चाचण्या
प्रति प्रयत्न पास दर 33.3% 39.6%
अस्थिर चाचण्या 2 1
एकूण रन 48 48
आउटपुट टोकन्स 1,511 1,264
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 1.22s 2.92s
प्रतिसाद वेळ (कमाल) 6.48s 8.21s
प्रतिसाद वेळ (एकूण) 19.53s 46.72s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 4.3 7.9 22.2% 1 562ms 245 0
GLM 5 Turbo 3.0 10.0 0.0% 0 3.01s 376 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 3.0 10.0 0.0% 0 6.48s 282 0
GLM 5 Turbo 3.0 10.0 0.0% 0 4.89s 144 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 10.0 10.0 100.0% 0 601ms 197 0
GLM 5 Turbo 10.0 10.0 100.0% 0 2.47s 204 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 3.0 10.0 0.0% 0 611ms 160 0
GLM 5 Turbo 5.3 10.0 33.3% 0 1.97s 25 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 5.0 10.0 0.0% 0 541ms 87 0
GLM 5 Turbo 4.2 9.9 0.0% 0 2.18s 48 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 4.8 10.0 0.0% 0 687ms 60 0
GLM 5 Turbo 6.5 10.0 50.0% 0 2.13s 65 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 5.9 7.2 55.6% 1 541ms 291 0
GLM 5 Turbo 5.5 7.4 44.4% 1 2.43s 180 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.79s 189 0
GLM 5 Turbo 10.0 10.0 100.0% 0 8.21s 222 0

झटपट तुलना

तुलना जोडी बदला