नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs Z.ai: GLM 5.1

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 none रिलीज़: 2026-05-28 GLM 5.1 GLM 5.1 medium रिलीज़: 2026-04-07
स्कोर 7.3 7.4
रैंक #63 #55
विश्वसनीयता 10.0 5.0
संगति 9.2 8.3
सही परीक्षण
प्रति प्रयास पास दर 65.0% 71.7%
अस्थिर टेस्ट 2 4
कुल रन 60 60
प्रति परिणाम लागत 4.324 2.382
कुल लागत $0.519 $0.279
इनपुट कीमत $5.000 / 1M $0.980 / 1M
आउटपुट कीमत $25.000 / 1M $3.080 / 1M
आउटपुट टोकन 8,098 11,511
रीजनिंग टोकन 0 71,979
प्रतिक्रिया समय (औसत) 3.51s 33.45s
प्रतिक्रिया समय (अधिकतम) 17.73s 172.60s
प्रतिक्रिया समय (कुल) 70.19s 635.63s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
GLM 5.1 10.0 10.0 100.0% 0 8.31s 401 5,122
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
GLM 5.1 4.7 1.6 66.7% 2 145.56s 4,727 34,384
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
GLM 5.1 9.5 10.0 100.0% 0 43.11s 327 4,206
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
GLM 5.1 10.0 10.0 100.0% 0 9.33s 991 4,552
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
GLM 5.1 5.3 10.0 33.3% 0 29.77s 969 11,314
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
GLM 5.1 10.0 10.0 100.0% 0 20.95s 2,875 2,875
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
GLM 5.1 6.4 5.8 66.7% 1 7.47s 204 1,617
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
GLM 5.1 8.2 7.2 88.9% 1 31.64s 935 5,730
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
GLM 5.1 3.0 10.0 0.0% 0 0ms 0 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
GLM 5.1 3.0 10.0 0.0% 0 29.40s 82 2,179

त्वरित तुलना

तुलना जोड़ी बदलें