नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Sonnet 5 vs Z.ai: GLM 5.2

सारांश

Claude Sonnet 5 vs GLM 5.2 benchmark तुलना: Claude Sonnet 5 average score में आगे है: 7.9 vs 7.1. GLM 5.2 की benchmark लागत कम है: $0.051 vs $0.550. GLM 5.2 तेज है: 6.34s vs 9.94s, pass rates 79.4% vs 60.3%.

अनुशंसित मॉडल: GLM 5.2 - Its score stays close to the best score here (7.1 vs 7.9), while costing about 10.9x less than Claude Sonnet 5.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-30

मेट्रिक Claude Sonnet 5 Claude Sonnet 5 medium रिलीज़: 2026-06-30 GLM 5.2 GLM 5.2 none रिलीज़: 2026-06-17
स्कोर 7.9 7.1
रैंक #30 #63
विश्वसनीयता 10.0 9.9
संगति 9.0 9.6
सही परीक्षण
प्रति प्रयास पास दर 79.4% 60.3%
अस्थिर टेस्ट 3 1
कुल रन 63 63
प्रति परिणाम लागत 3.662 0.628
कुल लागत $0.550 $0.051
इनपुट कीमत $2.000 / 1M $0.930 / 1M
आउटपुट कीमत $10.000 / 1M $3.000 / 1M
कुल इनपुट टोकन 67,416 38,671
आउटपुट टोकन 34,012 4,817
रीजनिंग टोकन 7,673 0
प्रतिक्रिया समय (औसत) 9.94s 6.34s
प्रतिक्रिया समय (अधिकतम) 56.94s 20.69s
प्रतिक्रिया समय (कुल) 208.71s 133.19s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#30 Claude Sonnet 5

medium
लागत
$0.007
समय
6.4s
टोकन
832 tok

#63 GLM 5.2

none
अमान्य SVG
लागत
$0.033
समय
87.7s
टोकन
7,455 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 10.0 10.0 100.0% 0 3.80s 834 1,220 446
GLM 5.2 8.3 10.0 75.0% 0 3.70s 567 313 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 9.0 7.9 88.9% 1 17.28s 10,590 13,153 2,379
GLM 5.2 3.7 9.5 0.0% 0 7.55s 7,263 1,958 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 4.5 2.1 66.7% 1 37.01s 29,394 4,848 2,170
GLM 5.2 10.0 10.0 100.0% 0 20.69s 14,296 1,489 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 10.0 10.0 100.0% 0 3.16s 10,503 312 0
GLM 5.2 10.0 10.0 100.0% 0 7.17s 7,113 204 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 7.7 10.0 66.7% 0 20.38s 975 12,140 1,994
GLM 5.2 5.3 10.0 33.3% 0 6.50s 696 27 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 4.8 3.2 33.3% 1 4.32s 708 264 0
GLM 5.2 6.1 3.1 66.7% 1 4.42s 480 82 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 9.9 10.0 100.0% 0 3.10s 909 318 269
GLM 5.2 9.8 10.0 100.0% 0 3.84s 642 66 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 7.7 10.0 66.7% 0 2.98s 894 407 121
GLM 5.2 7.7 10.0 66.7% 0 3.31s 618 265 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 10.0 10.0 100.0% 0 10.70s 12,351 433 90
GLM 5.2 10.0 10.0 100.0% 0 15.76s 6,807 400 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 3.0 10.0 0.0% 0 7.06s 258 917 204
GLM 5.2 3.0 10.0 0.0% 0 3.41s 189 13 0

त्वरित तुलना

तुलना जोड़ी बदलें