AI BENCHY तुलना

OpenAI: GPT-5.4 vs Z.ai: GLM 5.2

सारांश

GPT-5.4 vs GLM 5.2 benchmark तुलना: GLM 5.2 average score में आगे है: 8.7 vs 8.5. GLM 5.2 की benchmark लागत कम है: $0.324 vs $1.210. GPT-5.4 तेज है: 22.35s vs 23.28s, pass rates 76.2% vs 84.1%.

अनुशंसित मॉडल: GLM 5.2 - It has the best score here (8.7), while costing about 3.7x less than GPT-5.4.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-17

मेट्रिक	GPT-5.4 GPT-5.4 medium रिलीज़: 2026-03-05	GLM 5.2 GLM 5.2 medium रिलीज़: 2026-06-17

मेट्रिक	GPT-5.4 GPT-5.4 medium रिलीज़: 2026-03-05	GLM 5.2 GLM 5.2 medium रिलीज़: 2026-06-17
स्कोर	8.5	8.7
रैंक	#17	#14
विश्वसनीयता	10.0	9.5
संगति	8.6	8.4
सही परीक्षण
प्रति प्रयास पास दर	76.2%	84.1%
अस्थिर टेस्ट	4	4
कुल रन	63	63
प्रति परिणाम लागत	8.640	2.159
कुल लागत	$1.210	$0.324
इनपुट कीमत	$2.500 / 1M	$1.400 / 1M
आउटपुट कीमत	$15.000 / 1M	$4.400 / 1M
कुल इनपुट टोकन	34,108	37,199
आउटपुट टोकन	2,242	12,261
रीजनिंग टोकन	72,707	49,500
प्रतिक्रिया समय (औसत)	22.35s	23.28s
प्रतिक्रिया समय (अधिकतम)	100.41s	101.36s
प्रतिक्रिया समय (कुल)	469.29s	488.94s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#17 GPT-5.4

medium

Cost: $0.214
Time: 199.6s
Tokens: 14,349 tok

#14 GLM 5.2

medium

Cost: $0.041
Time: 195.8s
Tokens: 9,287 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	8.3	10.0	75.0%	0		4.11s	606	240	1,511
GLM 5.2	10.0	10.0	100.0%	0		5.89s	639	497	2,634

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	8.8	7.8	88.9%	1		44.36s	7,305	433	24,216
GLM 5.2	8.2	7.2	88.9%	1		40.96s	7,317	1,475	17,123

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	10.0	10.0	100.0%	0		20.57s	11,019	301	3,543
GLM 5.2	10.0	10.0	100.0%	0		51.96s	12,696	458	4,531

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	10.0	10.0	100.0%	0		5.32s	7,140	234	804
GLM 5.2	10.0	10.0	100.0%	0		13.44s	7,149	348	2,345

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	5.3	7.2	44.4%	1		74.27s	619	61	34,748
GLM 5.2	4.1	4.4	44.5%	2		45.47s	551	8,188	11,606

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	4.7	3.1	33.3%	1		4.92s	477	145	321
GLM 5.2	10.0	10.0	100.0%	0		17.39s	498	54	1,842

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	10.0	10.0	100.0%	0		3.11s	660	93	897
GLM 5.2	9.9	10.0	100.0%	0		7.90s	678	94	1,518

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	8.2	7.2	88.9%	1		9.14s	642	441	3,815
GLM 5.2	8.2	7.2	88.9%	1		13.13s	672	536	4,822

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	10.0	10.0	100.0%	0		13.28s	5,445	264	1,031
GLM 5.2	10.0	10.0	100.0%	0		20.41s	6,861	230	550

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	3.0	10.0	0.0%	0		13.95s	195	30	1,821
GLM 5.2	3.0	10.0	0.0%	0		34.25s	138	381	2,529

त्वरित तुलना

तुलना जोड़ी बदलें

GPT-5.2 ChatnonevsGLM 5.2medium DeepSeek V4 FlashhighvsGPT-5.4medium DeepSeek V4 FlashhighvsGLM 5.2medium Gemini 3.5 FlashlowvsGLM 5.2medium GPT-5.5lowvsGLM 5.2medium Gemini 3.5 FlashlowvsGPT-5.4medium GPT-5.4mediumvsStep 3.7 Flashlow DeepSeek V4 ProhighvsGPT-5.4medium Step 3.7 FlashlowvsGLM 5.2medium DeepSeek V4 ProhighvsGLM 5.2medium Gemini 3 Flash PreviewlowvsGPT-5.4medium GPT-5.3 ChatnonevsGLM 5.2medium