AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs Z.ai: GLM 5 Turbo

सारांश

Claude Opus 4.8 vs GLM 5 Turbo benchmark तुलना: GLM 5 Turbo average score में आगे है: 8.4 vs 7.2. GLM 5 Turbo की benchmark लागत कम है: $0.323 vs $0.539. Claude Opus 4.8 तेज है: 3.47s vs 23.00s, pass rates 61.9% vs 74.6%.

अनुशंसित मॉडल: GLM 5 Turbo - It has the best score here (8.4), while costing about 1.7x less than Claude Opus 4.8.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक	Claude Opus 4.8 Claude Opus 4.8 none रिलीज़: 2026-05-28	GLM 5 Turbo GLM 5 Turbo medium रिलीज़: 2026-03-15

मेट्रिक	Claude Opus 4.8 Claude Opus 4.8 none रिलीज़: 2026-05-28	GLM 5 Turbo GLM 5 Turbo medium रिलीज़: 2026-03-15
स्कोर	7.2	8.4
रैंक	#59	#24
विश्वसनीयता	10.0	10.0
संगति	9.2	8.5
सही परीक्षण
प्रति प्रयास पास दर	61.9%	74.6%
अस्थिर टेस्ट	2	4
कुल रन	63	63
प्रति परिणाम लागत	4.485	2.011
कुल लागत	$0.539	$0.323
इनपुट कीमत	$5.000 / 1M	$1.200 / 1M
आउटपुट कीमत	$25.000 / 1M	$4.000 / 1M
कुल इनपुट टोकन	67,104	35,593
आउटपुट टोकन	8,107	12,245
रीजनिंग टोकन	0	62,277
प्रतिक्रिया समय (औसत)	3.47s	23.00s
प्रतिक्रिया समय (अधिकतम)	17.73s	194.23s
प्रतिक्रिया समय (कुल)	72.90s	482.97s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#59 Claude Opus 4.8

none

Cost: $0.053
Time: 22.0s
Tokens: 2,253 tok

#24 GLM 5 Turbo

medium

Cost: $0.074
Time: 206.0s
Tokens: 18,549 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	6.5	10.0	50.0%	0		3.40s	834	1,472	0
GLM 5 Turbo	10.0	10.0	100.0%	0		4.82s	555	362	3,137

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	5.5	10.0	33.3%	0		3.29s	10,590	1,332	0
GLM 5 Turbo	8.2	9.3	66.7%	0		45.90s	5,941	363	25,381

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	9.5	10.0	100.0%	0		17.73s	29,658	3,259	0
GLM 5 Turbo	10.0	10.0	100.0%	0		13.88s	12,714	390	2,037

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	7.3	5.8	83.3%	1		1.77s	10,503	308	0
GLM 5 Turbo	10.0	10.0	100.0%	0		6.19s	7,107	577	3,632

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	5.3	7.2	44.4%	1		1.66s	975	61	0
GLM 5 Turbo	2.9	4.4	22.2%	2		71.07s	489	9,665	19,279

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	10.0	10.0	100.0%	0		3.48s	708	230	0
GLM 5 Turbo	6.1	3.1	66.7%	1		10.05s	477	60	2,216

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	9.9	10.0	100.0%	0		1.37s	909	95	0
GLM 5 Turbo	10.0	10.0	100.0%	0		5.38s	636	255	2,183

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	7.7	10.0	66.7%	0		2.74s	894	783	0
GLM 5 Turbo	8.7	7.9	77.8%	1		5.23s	609	312	2,647

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	10.0	10.0	100.0%	0		5.35s	11,775	355	0
GLM 5 Turbo	10.0	10.0	100.0%	0		9.84s	6,879	241	446

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	3.0	10.0	0.0%	0		3.41s	258	212	0
GLM 5 Turbo	3.0	10.0	0.0%	0		40.17s	186	20	1,319

त्वरित तुलना

तुलना जोड़ी बदलें