AI BENCHY तुलना

Anthropic: Claude Sonnet 4.6 vs Z.ai: GLM 5.2

सारांश

Claude Sonnet 4.6 vs GLM 5.2 benchmark तुलना: Claude Sonnet 4.6 average score में आगे है: 7.8 vs 7.1. GLM 5.2 की benchmark लागत कम है: $0.051 vs $1.418. GLM 5.2 तेज है: 6.34s vs 17.06s, pass rates 65.1% vs 60.3%.

अनुशंसित मॉडल: GLM 5.2 - Its score stays close to the best score here (7.1 vs 7.8), while costing about 28.1x less than Claude Sonnet 4.6.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक	Claude Sonnet 4.6 Claude Sonnet 4.6 medium रिलीज़: 2026-02-17	GLM 5.2 GLM 5.2 none रिलीज़: 2026-06-17

मेट्रिक	Claude Sonnet 4.6 Claude Sonnet 4.6 medium रिलीज़: 2026-02-17	GLM 5.2 GLM 5.2 none रिलीज़: 2026-06-17
स्कोर	7.8	7.1
रैंक	#32	#63
विश्वसनीयता	10.0	9.9
संगति	9.1	9.6
सही परीक्षण
प्रति प्रयास पास दर	65.1%	60.3%
अस्थिर टेस्ट	2	1
कुल रन	63	63
प्रति परिणाम लागत	10.904	0.628
कुल लागत	$1.418	$0.051
इनपुट कीमत	$3.000 / 1M	$0.930 / 1M
आउटपुट कीमत	$15.000 / 1M	$3.000 / 1M
कुल इनपुट टोकन	49,112	38,671
आउटपुट टोकन	54,703	4,817
रीजनिंग टोकन	29,970	0
प्रतिक्रिया समय (औसत)	17.06s	6.34s
प्रतिक्रिया समय (अधिकतम)	46.35s	20.69s
प्रतिक्रिया समय (कुल)	221.83s	133.19s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#32 Claude Sonnet 4.6

medium

अमान्य SVG

लागत: $0.000
समय: 300.0s
टोकन: 0 tok

#63 GLM 5.2

none

अमान्य SVG

लागत: $0.033
समय: 87.7s
टोकन: 7,455 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 4.6	6.5	10.0	50.0%	0		2.98s	789	1,046	1,093
GLM 5.2	8.3	10.0	75.0%	0		3.70s	567	313	0

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 4.6	5.7	6.6	44.4%	1		33.29s	6,995	16,089	3,686
GLM 5.2	3.7	9.5	0.0%	0		7.55s	7,263	1,958	0

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 4.6	10.0	10.0	100.0%	0		46.35s	18,351	5,871	3,962
GLM 5.2	10.0	10.0	100.0%	0		20.69s	14,296	1,489	0

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 4.6	10.0	10.0	100.0%	0		13.90s	8,676	649	742
GLM 5.2	10.0	10.0	100.0%	0		7.17s	7,113	204	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 4.6	2.9	7.2	11.1%	1		0ms	471	25,790	16,919
GLM 5.2	5.3	10.0	33.3%	0		6.50s	696	27	0

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.94s	564	256	433
GLM 5.2	6.1	3.1	66.7%	1		4.42s	480	82	0

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 4.6	10.0	10.0	100.0%	0		2.61s	792	318	552
GLM 5.2	9.8	10.0	100.0%	0		3.84s	642	66	0

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 4.6	10.0	10.0	100.0%	0		5.31s	816	592	646
GLM 5.2	7.7	10.0	66.7%	0		3.31s	618	265	0

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 4.6	10.0	10.0	100.0%	0		7.48s	11,454	655	351
GLM 5.2	10.0	10.0	100.0%	0		15.76s	6,807	400	0

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 4.6	3.0	10.0	0.0%	0		30.09s	204	3,437	1,586
GLM 5.2	3.0	10.0	0.0%	0		3.41s	189	13	0

त्वरित तुलना

तुलना जोड़ी बदलें

Gemma 4 26B A4Bmediumनिःशुल्क उपलब्धvsGLM 5.2none Step 3.7 FlashhighvsGLM 5.2none Laguna XS 2.1mediumनिःशुल्क उपलब्धvsGLM 5.2none Kimi K2.7 CodemediumvsGLM 5.2none Claude Sonnet 4.6mediumvsStep 3.7 Flashlow Grok 4.20mediumvsGLM 5.2none Claude Sonnet 4.6mediumvsDeepSeek V4 Prohigh Gemini 3 Flash PreviewlowvsGLM 5.2none MiMo-V2.5-PromediumvsGLM 5.2none Seed-2.0-MinimediumvsGLM 5.2none Qwen3.5-FlashmediumvsGLM 5.2none Gemini 3.5 FlashminimalvsGLM 5.2none