नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Opus 4.6 vs Z.ai: GLM 5

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-01

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium रिलीज़: 2026-02-05 GLM 5 GLM 5 none रिलीज़: 2026-02-12
स्कोर 7.6 6.6
रैंक #50 #70
विश्वसनीयता लागू नहीं लागू नहीं
संगति 9.1 9.6
सही परीक्षण
प्रति प्रयास पास दर 70.4% 51.9%
अस्थिर टेस्ट 2 1
कुल रन 54 54
प्रति परिणाम लागत 12.047 0.217
कुल लागत $1.446 $0.020
???? ??? $5.000 / 1M $0.600 / 1M
????? ??? $25.000 / 1M $2.080 / 1M
आउटपुट टोकन 29,829 1,959
रीजनिंग टोकन 18,938 0
प्रतिक्रिया समय (औसत) 21.08s 4.23s
प्रतिक्रिया समय (अधिकतम) 83.40s 11.07s
प्रतिक्रिया समय (कुल) 231.84s 46.51s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
GLM 5 4.8 10.0 25.0% 0 2.37s 275 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
GLM 5 5.6 3.5 33.3% 1 8.84s 408 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
GLM 5 3.0 10.0 0.0% 0 4.98s 406 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
GLM 5 10.0 10.0 100.0% 0 5.78s 203 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
GLM 5 3.0 10.0 0.0% 0 2.24s 19 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
GLM 5 10.0 10.0 100.0% 0 3.27s 103 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
GLM 5 10.0 10.0 100.0% 0 1.48s 61 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
GLM 5 7.7 10.0 66.7% 0 2.05s 264 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
GLM 5 10.0 10.0 100.0% 0 11.07s 220 0

त्वरित तुलना

तुलना जोड़ी बदलें