AI BENCHY तुलना

OpenAI: GPT-5.4 vs Z.ai: GLM 5

सारांश

GPT-5.4 vs GLM 5 benchmark तुलना: average score लगभग बराबर है: 8.5 vs 8.6. GLM 5 की benchmark लागत कम है: $0.228 vs $1.210. GPT-5.4 तेज है: 22.35s vs 33.54s, pass rates 76.2% vs 82.5%.

अनुशंसित मॉडल: GLM 5 - It has the best score here (8.6), while costing about 5.3x less than GPT-5.4.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक	GPT-5.4 GPT-5.4 medium रिलीज़: 2026-03-05	GLM 5 GLM 5 medium रिलीज़: 2026-02-12

मेट्रिक	GPT-5.4 GPT-5.4 medium रिलीज़: 2026-03-05	GLM 5 GLM 5 medium रिलीज़: 2026-02-12
स्कोर	8.5	8.6
रैंक	#17	#15
विश्वसनीयता	10.0	10.0
संगति	8.6	8.5
सही परीक्षण
प्रति प्रयास पास दर	76.2%	82.5%
अस्थिर टेस्ट	4	4
कुल रन	63	63
प्रति परिणाम लागत	8.640	1.668
कुल लागत	$1.210	$0.228
इनपुट कीमत	$2.500 / 1M	$0.600 / 1M
आउटपुट कीमत	$15.000 / 1M	$1.920 / 1M
कुल इनपुट टोकन	34,108	35,224
आउटपुट टोकन	2,242	21,570
रीजनिंग टोकन	72,707	102,996
प्रतिक्रिया समय (औसत)	22.35s	33.54s
प्रतिक्रिया समय (अधिकतम)	100.41s	99.85s
प्रतिक्रिया समय (कुल)	469.29s	435.99s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#17 GPT-5.4

medium

लागत: $0.214
समय: 199.6s
टोकन: 14,349 tok

#15 GLM 5

medium

लागत: $0.005
समय: 20.7s
टोकन: 2,068 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	8.3	10.0	75.0%	0		4.11s	606	240	1,511
GLM 5	10.0	10.0	100.0%	0		23.66s	555	480	7,056

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	8.8	7.8	88.9%	1		44.36s	7,305	433	24,216
GLM 5	10.0	10.0	100.0%	0		74.30s	7,254	2,997	52,930

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	10.0	10.0	100.0%	0		20.57s	11,019	301	3,543
GLM 5	10.0	10.0	100.0%	0		28.96s	12,804	662	3,242

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	10.0	10.0	100.0%	0		5.32s	7,140	234	804
GLM 5	7.1	5.6	83.3%	1		8.90s	5,508	567	3,734

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	5.3	7.2	44.4%	1		74.27s	619	61	34,748
GLM 5	3.5	4.4	33.3%	2		0ms	260	13,176	14,137

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	4.7	3.1	33.3%	1		4.92s	477	145	321
GLM 5	6.1	3.1	66.7%	1		14.69s	477	2,020	2,248

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	10.0	10.0	100.0%	0		3.11s	660	93	897
GLM 5	10.0	10.0	100.0%	0		7.25s	636	1,001	2,129

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	8.2	7.2	88.9%	1		9.14s	642	441	3,815
GLM 5	10.0	10.0	100.0%	0		11.33s	609	33	4,076

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	10.0	10.0	100.0%	0		13.28s	5,445	264	1,031
GLM 5	10.0	10.0	100.0%	0		15.93s	6,935	233	994

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4	3.0	10.0	0.0%	0		13.95s	195	30	1,821
GLM 5	3.0	10.0	0.0%	0		67.37s	186	401	12,450

त्वरित तुलना

तुलना जोड़ी बदलें

GPT-5.2 ChatnonevsGLM 5medium DeepSeek V4 FlashhighvsGPT-5.4medium DeepSeek V4 FlashhighvsGLM 5medium Gemini 3.5 FlashlowvsGLM 5medium Gemini 3.5 FlashlowvsGPT-5.4medium GPT-5.5lowvsGLM 5medium Claude Opus 4.8lowvsGPT-5.4medium Claude Opus 4.8lowvsGLM 5medium GPT-5.4mediumvsStep 3.7 Flashlow Step 3.7 FlashlowvsGLM 5medium DeepSeek V4 ProhighvsGPT-5.4medium DeepSeek V4 ProhighvsGLM 5medium