नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Grok 4.20 Beta vs Z.ai: GLM 5V Turbo

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-02

मेट्रिक Grok 4.20 Beta Grok 4.20 Beta medium रिलीज़: 2026-03-12 GLM 5V Turbo GLM 5V Turbo medium रिलीज़: 2026-04-01
स्कोर 7.9 7.7
रैंक #26 #30
संगति 9.0 7.4
सही परीक्षण
प्रति प्रयास पास दर 72.6% 76.5%
अस्थिर टेस्ट 2 6
कुल रन 51 51
प्रति परिणाम लागत 5.525 2.697
कुल लागत $0.608 $0.270
???? ??? $0.000 / 1M $1.200 / 1M
????? ??? $0.000 / 1M $4.000 / 1M
आउटपुट टोकन 1,487 1,947
रीजनिंग टोकन 87,922 54,313
प्रतिक्रिया समय (औसत) 8.54s 15.03s
प्रतिक्रिया समय (अधिकतम) 24.21s 67.08s
प्रतिक्रिया समय (कुल) 145.26s 255.55s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Beta 8.7 7.9 91.7% 1 3.16s 268 7,583
GLM 5V Turbo 7.2 6.1 75.0% 2 10.76s 587 7,872
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 227 12,212
GLM 5V Turbo 6.9 3.8 66.7% 1 15.06s 403 2,523
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.01s 180 5,281
GLM 5V Turbo 10.0 10.0 100.0% 0 9.60s 236 4,333
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Beta 5.3 10.0 33.3% 0 21.33s 251 40,255
GLM 5V Turbo 5.3 7.2 44.4% 1 38.15s 32 29,035
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 72 3,440
GLM 5V Turbo 10.0 10.0 100.0% 0 11.09s 131 2,183
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Beta 8.3 10.0 50.0% 0 4.97s 57 7,107
GLM 5V Turbo 9.9 10.0 100.0% 0 3.74s 72 1,813
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Beta 8.2 7.2 88.9% 1 3.85s 249 6,660
GLM 5V Turbo 7.7 7.3 77.8% 1 10.91s 193 5,789
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 Beta 3.0 10.0 0.0% 0 12.39s 183 5,384
GLM 5V Turbo 7.0 3.7 66.7% 1 12.53s 293 765

त्वरित तुलना

तुलना जोड़ी बदलें