AI BENCHY तुलना

Qwen: Qwen3.7 Max vs Z.ai: GLM 5.2

सारांश

Qwen3.7 Max vs GLM 5.2 benchmark तुलना: GLM 5.2 average score में आगे है: 7.1 vs 6.9. Qwen3.7 Max की benchmark लागत कम है: $0.054 vs $0.076. Qwen3.7 Max तेज है: 1.30s vs 6.34s, pass rates 66.7% vs 60.3%.

अनुशंसित मॉडल: Qwen3.7 Max - Its score stays close to the best score here (6.9 vs 7.1), while responding about 4.9x faster than GLM 5.2.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक	Qwen3.7 Max Qwen3.7 Max none रिलीज़: 2026-05-22	GLM 5.2 GLM 5.2 none रिलीज़: 2026-06-17

मेट्रिक	Qwen3.7 Max Qwen3.7 Max none रिलीज़: 2026-05-22	GLM 5.2 GLM 5.2 none रिलीज़: 2026-06-17
स्कोर	6.9	7.1
रैंक	#68	#61
विश्वसनीयता	10.0	9.9
संगति	10.0	9.6
सही परीक्षण
प्रति प्रयास पास दर	66.7%	60.3%
अस्थिर टेस्ट	0	1
कुल रन	63	63
प्रति परिणाम लागत	0.744	0.628
कुल लागत	$0.054	$0.076
इनपुट कीमत	$1.250 / 1M	$1.400 / 1M
आउटपुट कीमत	$3.750 / 1M	$4.400 / 1M
कुल इनपुट टोकन	37,107	38,671
आउटपुट टोकन	1,994	4,817
रीजनिंग टोकन	0	0
प्रतिक्रिया समय (औसत)	1.30s	6.34s
प्रतिक्रिया समय (अधिकतम)	3.92s	20.69s
प्रतिक्रिया समय (कुल)	27.21s	133.19s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#68 Qwen3.7 Max

none

लागत: $0.046
समय: 195.0s
टोकन: 12,171 tok

#61 GLM 5.2

none

अमान्य SVG

लागत: $0.033
समय: 87.7s
टोकन: 7,455 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Max	6.5	10.0	50.0%	0		1.08s	696	242	0
GLM 5.2	8.3	10.0	75.0%	0		3.70s	567	313	0

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Max	5.5	10.0	33.3%	0		1.35s	7,911	582	0
GLM 5.2	3.7	9.5	0.0%	0		7.55s	7,263	1,958	0

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Max	3.0	10.0	0.0%	0		2.17s	9,549	171	0
GLM 5.2	10.0	10.0	100.0%	0		20.69s	14,296	1,489	0

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Max	10.0	10.0	100.0%	0		1.35s	7,794	243	0
GLM 5.2	10.0	10.0	100.0%	0		7.17s	7,113	204	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Max	7.7	10.0	66.7%	0		975ms	789	15	0
GLM 5.2	5.3	10.0	33.3%	0		6.50s	696	27	0

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Max	10.0	10.0	100.0%	0		1.04s	522	120	0
GLM 5.2	6.1	3.1	66.7%	1		4.42s	480	82	0

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Max	10.0	10.0	100.0%	0		943ms	711	72	0
GLM 5.2	9.8	10.0	100.0%	0		3.84s	642	66	0

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Max	10.0	10.0	100.0%	0		1.13s	714	314	0
GLM 5.2	7.7	10.0	66.7%	0		3.31s	618	265	0

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Max	10.0	10.0	100.0%	0		3.92s	8,211	222	0
GLM 5.2	10.0	10.0	100.0%	0		15.76s	6,807	400	0

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Max	3.0	10.0	0.0%	0		856ms	210	13	0
GLM 5.2	3.0	10.0	0.0%	0		3.41s	189	13	0

त्वरित तुलना

तुलना जोड़ी बदलें

Gemini 3.5 FlashminimalvsQwen3.7 Maxnone Gemma 4 26B A4Bmediumनिःशुल्क उपलब्धvsGLM 5.2none Step 3.7 FlashhighvsGLM 5.2none Ring-2.6-1TmediumvsQwen3.7 Maxnone Kimi K2.7 CodemediumvsGLM 5.2none Qwen3.7 MaxnonevsMiMo-V2.5medium Kimi K2.7 CodemediumvsQwen3.7 Maxnone gpt-oss-120bmediumनिःशुल्क उपलब्धvsQwen3.7 Maxnone GPT-5 NanomediumvsQwen3.7 Maxnone Grok 4.20mediumvsGLM 5.2none Qwen3.7 MaxnonevsGLM 5.1medium Qwen3.7 MaxnonevsStep 3.7 Flashhigh