AI BENCHY तुलना

Google: Gemini 3.1 Pro Preview vs Z.ai: GLM 5.2

सारांश

Gemini 3.1 Pro Preview vs GLM 5.2 benchmark तुलना: Gemini 3.1 Pro Preview average score में आगे है: 9.2 vs 7.1. GLM 5.2 की benchmark लागत कम है: $0.076 vs $1.054. GLM 5.2 तेज है: 6.34s vs 20.14s, pass rates 90.5% vs 60.3%.

अनुशंसित मॉडल: Gemini 3.1 Pro Preview - It has the strongest score in this comparison (9.2) and the best overall balance of cost and response time across all 2 models.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium रिलीज़: 2026-02-19	GLM 5.2 GLM 5.2 none रिलीज़: 2026-06-17

मेट्रिक	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium रिलीज़: 2026-02-19	GLM 5.2 GLM 5.2 none रिलीज़: 2026-06-17
स्कोर	9.2	7.1
रैंक	#7	#61
विश्वसनीयता	10.0	9.9
संगति	10.0	9.6
सही परीक्षण
प्रति प्रयास पास दर	90.5%	60.3%
अस्थिर टेस्ट	0	1
कुल रन	63	63
प्रति परिणाम लागत	5.546	0.628
कुल लागत	$1.054	$0.076
इनपुट कीमत	$2.000 / 1M	$1.400 / 1M
आउटपुट कीमत	$12.000 / 1M	$4.400 / 1M
कुल इनपुट टोकन	41,617	38,671
आउटपुट टोकन	1,977	4,817
रीजनिंग टोकन	78,896	0
प्रतिक्रिया समय (औसत)	20.14s	6.34s
प्रतिक्रिया समय (अधिकतम)	88.68s	20.69s
प्रतिक्रिया समय (कुल)	281.92s	133.19s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#7 Gemini 3.1 Pro Preview

medium

लागत: $0.115
समय: 87.2s
टोकन: 9,629 tok

#61 GLM 5.2

none

अमान्य SVG

लागत: $0.033
समय: 87.7s
टोकन: 7,455 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	498	112	3,218
GLM 5.2	8.3	10.0	75.0%	0		3.70s	567	313	0

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Gemini 3.1 Pro Preview	7.9	9.9	66.7%	0		40.17s	8,124	435	41,247
GLM 5.2	3.7	9.5	0.0%	0		7.55s	7,263	1,958	0

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	17,240	432	9,281
GLM 5.2	10.0	10.0	100.0%	0		20.69s	14,296	1,489	0

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	7,265	279	3,904
GLM 5.2	10.0	10.0	100.0%	0		7.17s	7,113	204	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	635	18	12,424
GLM 5.2	5.3	10.0	33.3%	0		6.50s	696	27	0

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	490	108	1,179
GLM 5.2	6.1	3.1	66.7%	1		4.42s	480	82	0

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	621	72	2,236
GLM 5.2	9.8	10.0	100.0%	0		3.84s	642	66	0

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.90s	570	235	3,128
GLM 5.2	7.7	10.0	66.7%	0		3.31s	618	265	0

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	6,018	274	982
GLM 5.2	10.0	10.0	100.0%	0		15.76s	6,807	400	0

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.27s	156	12	1,297
GLM 5.2	3.0	10.0	0.0%	0		3.41s	189	13	0

त्वरित तुलना

तुलना जोड़ी बदलें

Gemma 4 26B A4Bmediumनिःशुल्क उपलब्धvsGLM 5.2none Step 3.7 FlashhighvsGLM 5.2none Kimi K2.7 CodemediumvsGLM 5.2none Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Grok 4.20mediumvsGLM 5.2none Gemini 3 Flash PreviewlowvsGLM 5.2none MiMo-V2.5-PromediumvsGLM 5.2none Seed-2.0-MinimediumvsGLM 5.2none Qwen3.5-FlashmediumvsGLM 5.2none Gemini 3.5 FlashminimalvsGLM 5.2none DeepSeek V3.2mediumvsGLM 5.2none Qwen3.6 FlashmediumvsGLM 5.2none