AI BENCHY तुलना

Qwen: Qwen3.6 Plus vs Z.ai: GLM 5.2

सारांश

Qwen3.6 Plus vs GLM 5.2 benchmark तुलना: Qwen3.6 Plus average score में आगे है: 7.8 vs 7.1. GLM 5.2 की benchmark लागत कम है: $0.051 vs $0.294. GLM 5.2 तेज है: 6.34s vs 30.70s, pass rates 69.8% vs 60.3%.

अनुशंसित मॉडल: GLM 5.2 - Its score stays close to the best score here (7.1 vs 7.8), while costing about 5.8x less than Qwen3.6 Plus.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक	Qwen3.6 Plus Qwen3.6 Plus medium रिलीज़: 2026-04-20	GLM 5.2 GLM 5.2 none रिलीज़: 2026-06-17

मेट्रिक	Qwen3.6 Plus Qwen3.6 Plus medium रिलीज़: 2026-04-20	GLM 5.2 GLM 5.2 none रिलीज़: 2026-06-17
स्कोर	7.8	7.1
रैंक	#31	#63
विश्वसनीयता	10.0	9.9
संगति	9.3	9.6
सही परीक्षण
प्रति प्रयास पास दर	69.8%	60.3%
अस्थिर टेस्ट	2	1
कुल रन	63	63
प्रति परिणाम लागत	0.831	0.628
कुल लागत	$0.294	$0.051
इनपुट कीमत	$0.325 / 1M	$0.930 / 1M
आउटपुट कीमत	$1.950 / 1M	$3.000 / 1M
कुल इनपुट टोकन	41,565	38,671
आउटपुट टोकन	1,853	4,817
रीजनिंग टोकन	141,973	0
प्रतिक्रिया समय (औसत)	30.70s	6.34s
प्रतिक्रिया समय (अधिकतम)	201.68s	20.69s
प्रतिक्रिया समय (कुल)	613.99s	133.19s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#31 Qwen3.6 Plus

medium

लागत: $0.024
समय: 219.0s
टोकन: 12,235 tok

#63 GLM 5.2

none

अमान्य SVG

लागत: $0.033
समय: 87.7s
टोकन: 7,455 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.6 Plus	10.0	10.0	100.0%	0		9.90s	672	207	7,557
GLM 5.2	8.3	10.0	75.0%	0		3.70s	567	313	0

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.6 Plus	6.1	7.8	44.4%	1		153.12s	7,098	58	50,586
GLM 5.2	3.7	9.5	0.0%	0		7.55s	7,263	1,958	0

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.6 Plus	10.0	10.0	100.0%	0		34.95s	14,934	452	13,073
GLM 5.2	10.0	10.0	100.0%	0		20.69s	14,296	1,489	0

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.6 Plus	10.0	10.0	100.0%	0		14.95s	7,782	270	10,706
GLM 5.2	10.0	10.0	100.0%	0		7.17s	7,113	204	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.6 Plus	2.9	7.2	11.1%	1		29.59s	771	56	33,464
GLM 5.2	5.3	10.0	33.3%	0		6.50s	696	27	0

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.6 Plus	5.1	10.0	0.0%	0		27.05s	516	111	5,232
GLM 5.2	6.1	3.1	66.7%	1		4.42s	480	82	0

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.6 Plus	10.0	10.0	100.0%	0		7.54s	699	102	5,552
GLM 5.2	9.8	10.0	100.0%	0		3.84s	642	66	0

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.6 Plus	10.0	10.0	100.0%	0		6.34s	696	309	6,712
GLM 5.2	7.7	10.0	66.7%	0		3.31s	618	265	0

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.6 Plus	10.0	10.0	100.0%	0		5.87s	8,193	267	1,330
GLM 5.2	10.0	10.0	100.0%	0		15.76s	6,807	400	0

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.6 Plus	3.0	10.0	0.0%	0		47.51s	204	21	7,761
GLM 5.2	3.0	10.0	0.0%	0		3.41s	189	13	0

त्वरित तुलना

तुलना जोड़ी बदलें

Gemma 4 26B A4Bmediumनिःशुल्क उपलब्धvsGLM 5.2none Step 3.7 FlashhighvsGLM 5.2none Laguna XS 2.1mediumनिःशुल्क उपलब्धvsGLM 5.2none Claude Opus 4.8lowvsQwen3.6 Plusmedium Kimi K2.7 CodemediumvsGLM 5.2none Qwen3.6 PlusmediumvsStep 3.7 Flashlow Grok 4.20mediumvsGLM 5.2none DeepSeek V4 ProhighvsQwen3.6 Plusmedium Gemini 3 Flash PreviewlowvsGLM 5.2none MiMo-V2.5-PromediumvsGLM 5.2none Seed-2.0-MinimediumvsGLM 5.2none Qwen3.5-FlashmediumvsGLM 5.2none