AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Lite vs Z.ai: GLM 5

सारांश

Seed-2.0-Lite vs GLM 5 benchmark तुलना: GLM 5 average score में आगे है: 8.6 vs 8.5. Seed-2.0-Lite की benchmark लागत कम है: $0.175 vs $0.228. GLM 5 तेज है: 33.54s vs 47.07s, pass rates 76.2% vs 82.5%.

अनुशंसित मॉडल: GLM 5 - It has the strongest score in this comparison (8.6) and the best overall balance of cost and response time across all 2 models.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक	Seed-2.0-Lite Seed-2.0-Lite medium रिलीज़: 2026-02-14	GLM 5 GLM 5 medium रिलीज़: 2026-02-12

मेट्रिक	Seed-2.0-Lite Seed-2.0-Lite medium रिलीज़: 2026-02-14	GLM 5 GLM 5 medium रिलीज़: 2026-02-12
स्कोर	8.5	8.6
रैंक	#18	#15
विश्वसनीयता	10.0	10.0
संगति	9.0	8.5
सही परीक्षण
प्रति प्रयास पास दर	76.2%	82.5%
अस्थिर टेस्ट	3	4
कुल रन	63	63
प्रति परिणाम लागत	1.250	1.668
कुल लागत	$0.175	$0.228
इनपुट कीमत	$0.250 / 1M	$0.600 / 1M
आउटपुट कीमत	$2.000 / 1M	$1.920 / 1M
कुल इनपुट टोकन	46,740	35,224
आउटपुट टोकन	3,230	21,570
रीजनिंग टोकन	78,406	102,996
प्रतिक्रिया समय (औसत)	47.07s	33.54s
प्रतिक्रिया समय (अधिकतम)	254.92s	99.85s
प्रतिक्रिया समय (कुल)	988.37s	435.99s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#18 Seed-2.0-Lite

medium

लागत: $0.005
समय: 86.7s
टोकन: 2,354 tok

#15 GLM 5

medium

लागत: $0.005
समय: 20.7s
टोकन: 2,068 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	942	996	7,142
GLM 5	10.0	10.0	100.0%	0		23.66s	555	480	7,056

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	8.0	9.8	66.7%	0		156.74s	8,247	458	31,890
GLM 5	10.0	10.0	100.0%	0		74.30s	7,254	2,997	52,930

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	16,254	506	4,299
GLM 5	10.0	10.0	100.0%	0		28.96s	12,804	662	3,242

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	8,562	246	1,742
GLM 5	7.1	5.6	83.3%	1		8.90s	5,508	567	3,734

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	843	15	23,897
GLM 5	3.5	4.4	33.3%	2		0ms	260	13,176	14,137

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	582	304	1,620
GLM 5	6.1	3.1	66.7%	1		14.69s	477	2,020	2,248

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	834	71	1,480
GLM 5	10.0	10.0	100.0%	0		7.25s	636	1,001	2,129

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	9.0	7.9	88.9%	1		10.23s	894	403	3,285
GLM 5	10.0	10.0	100.0%	0		11.33s	609	33	4,076

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	9,306	222	1,011
GLM 5	10.0	10.0	100.0%	0		15.93s	6,935	233	994

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	3.0	10.0	0.0%	0		48.32s	276	9	2,040
GLM 5	3.0	10.0	0.0%	0		67.37s	186	401	12,450

त्वरित तुलना

तुलना जोड़ी बदलें

Seed-2.0-LitemediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsGLM 5medium Seed-2.0-LitemediumvsDeepSeek V4 Flashhigh DeepSeek V4 FlashhighvsGLM 5medium Gemini 3.5 FlashlowvsGLM 5medium Claude Opus 4.8lowvsSeed-2.0-Litemedium Seed-2.0-LitemediumvsGemini 3.5 Flashlow GPT-5.5lowvsGLM 5medium Seed-2.0-LitemediumvsStep 3.7 Flashlow Claude Opus 4.8lowvsGLM 5medium Seed-2.0-LitemediumvsGPT-5.5low Step 3.7 FlashlowvsGLM 5medium