AI BENCHY तुलना

Anthropic: Claude Sonnet 5 vs Z.ai: GLM 5.2

सारांश

Claude Sonnet 5 vs GLM 5.2 benchmark तुलना: Claude Sonnet 5 average score में आगे है: 7.9 vs 7.1. GLM 5.2 की benchmark लागत कम है: $0.051 vs $0.550. GLM 5.2 तेज है: 6.34s vs 9.94s, pass rates 79.4% vs 60.3%.

अनुशंसित मॉडल: GLM 5.2 - Its score stays close to the best score here (7.1 vs 7.9), while costing about 10.9x less than Claude Sonnet 5.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-30

मेट्रिक	Claude Sonnet 5 Claude Sonnet 5 medium रिलीज़: 2026-06-30	GLM 5.2 GLM 5.2 none रिलीज़: 2026-06-17

मेट्रिक	Claude Sonnet 5 Claude Sonnet 5 medium रिलीज़: 2026-06-30	GLM 5.2 GLM 5.2 none रिलीज़: 2026-06-17
स्कोर	7.9	7.1
रैंक	#30	#63
विश्वसनीयता	10.0	9.9
संगति	9.0	9.6
सही परीक्षण
प्रति प्रयास पास दर	79.4%	60.3%
अस्थिर टेस्ट	3	1
कुल रन	63	63
प्रति परिणाम लागत	3.662	0.628
कुल लागत	$0.550	$0.051
इनपुट कीमत	$2.000 / 1M	$0.930 / 1M
आउटपुट कीमत	$10.000 / 1M	$3.000 / 1M
कुल इनपुट टोकन	67,416	38,671
आउटपुट टोकन	34,012	4,817
रीजनिंग टोकन	7,673	0
प्रतिक्रिया समय (औसत)	9.94s	6.34s
प्रतिक्रिया समय (अधिकतम)	56.94s	20.69s
प्रतिक्रिया समय (कुल)	208.71s	133.19s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#30 Claude Sonnet 5

medium

लागत: $0.007
समय: 6.4s
टोकन: 832 tok

#63 GLM 5.2

none

अमान्य SVG

लागत: $0.033
समय: 87.7s
टोकन: 7,455 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	10.0	10.0	100.0%	0		3.80s	834	1,220	446
GLM 5.2	8.3	10.0	75.0%	0		3.70s	567	313	0

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	9.0	7.9	88.9%	1		17.28s	10,590	13,153	2,379
GLM 5.2	3.7	9.5	0.0%	0		7.55s	7,263	1,958	0

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	4.5	2.1	66.7%	1		37.01s	29,394	4,848	2,170
GLM 5.2	10.0	10.0	100.0%	0		20.69s	14,296	1,489	0

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	10.0	10.0	100.0%	0		3.16s	10,503	312	0
GLM 5.2	10.0	10.0	100.0%	0		7.17s	7,113	204	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	7.7	10.0	66.7%	0		20.38s	975	12,140	1,994
GLM 5.2	5.3	10.0	33.3%	0		6.50s	696	27	0

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	4.8	3.2	33.3%	1		4.32s	708	264	0
GLM 5.2	6.1	3.1	66.7%	1		4.42s	480	82	0

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	9.9	10.0	100.0%	0		3.10s	909	318	269
GLM 5.2	9.8	10.0	100.0%	0		3.84s	642	66	0

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	7.7	10.0	66.7%	0		2.98s	894	407	121
GLM 5.2	7.7	10.0	66.7%	0		3.31s	618	265	0

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	10.0	10.0	100.0%	0		10.70s	12,351	433	90
GLM 5.2	10.0	10.0	100.0%	0		15.76s	6,807	400	0

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	3.0	10.0	0.0%	0		7.06s	258	917	204
GLM 5.2	3.0	10.0	0.0%	0		3.41s	189	13	0

त्वरित तुलना

तुलना जोड़ी बदलें

Gemma 4 26B A4Bmediumनिःशुल्क उपलब्धvsGLM 5.2none Step 3.7 FlashhighvsGLM 5.2none Kimi K2.7 CodemediumvsGLM 5.2none Claude Sonnet 5mediumvsStep 3.7 Flashlow Grok 4.20mediumvsGLM 5.2none Gemini 3 Flash PreviewlowvsGLM 5.2none Claude Sonnet 5mediumvsDeepSeek V4 Prohigh MiMo-V2.5-PromediumvsGLM 5.2none Seed-2.0-MinimediumvsGLM 5.2none Qwen3.5-FlashmediumvsGLM 5.2none Gemini 3.5 FlashminimalvsGLM 5.2none DeepSeek V3.2mediumvsGLM 5.2none