#66

GLM 5.1

Z.ai प्रकाशन: 2026-04-07 चाचणी तारीख: 2026-06-04 13:06 z-ai/glm-5.1::medium

(medium) (none)

सारांश

GLM 5.1 AI BENCHY वर 7.1 स्कोर करते आणि #66 वर आहे. याची reliability 6.7, pass rate 68.3%, एकूण खर्च $0.395, आणि सरासरी response time 33.67s आहे.

स्कोअर

7.1

सुसंगतता

8.3

विश्वसनीयता

6.7

एकूण खर्च (सध्याची किंमत)

$0.395 ↑ +31.7%

या किमतीवर चाचणी केली: $0.300

एकूण आउटपुट टोकन्स

87,076

एकूण इनपुट टोकन्स

32,995

इनपुट किंमत

$0.975 / 1M

आउटपुट किंमत

$4.301 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 9

प्रति प्रयत्न पास दर: 68.3%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

33.67s

प्रतिसाद वेळ (कमाल): 172.60s

प्रतिसाद वेळ (एकूण): 673.41s

चुकीचे उत्तर: 4 वेळ संपला: 2 API त्रुटी: 1 अतिरिक्त फॉरमॅटिंग: 1 उत्तर नाही: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#66 GLM 5.1

medium

अवैध SVG

खर्च: $0.000
वेळ: 300.0s
टोकन्स: 0 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:06 नवीन चाचणी जोडली	7.3	6.7	$0.292 ↓	सध्याची रन
2026-05-21 23:46 सूट बदलला	7.4	3.3	$0.286	तुलना करा
2026-05-08 14:41 सूट बदलला	7.6	0.0	$0.209	तुलना करा
2026-05-08 14:41 सूट बदलला	7.6	0.0	$0.209	तुलना करा
2026-04-22 12:55 पहिली नोंदलेली रन	7.8	लागू नाही	$0.201	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण इनपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-06-04 13:06 · सध्याची रन	7.1	8.3	6.7	12/21	4	87,076	32,995	$0.395	33.67s
2026-04-22 12:55 · पहिली नोंदलेली रन	7.8	8.6	लागू नाही	12/18	3	57,095	0	$0.201	24.13s
फरक	-0.7	-0.3		0	+1	+29981	+32995	+$0.194	+9538ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख	इनपुट किंमत	आउटपुट किंमत
2026-06-04 15:40	$0.980 / 1M	$3.080 / 1M
2026-06-30 21:25	$0.975 / 1M	$4.301 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

GLM 5.1mediumvsDeepSeek V4 Pronone GLM 5.1mediumvsQwen3.7 Plusnone GLM 5.1mediumvsClaude Opus 4.8none GLM 5.1mediumvsGLM 5.2none GLM 5.1mediumvsGemini 3.5 Flashhigh GLM 5.1mediumvsGemini 3 Flash Previewmedium GLM 5.1mediumvsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध GLM 5.1mediumvsGPT-5.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	10.0	10.0
कोडिंग	4.6	3.7
संयुक्त	9.5	10.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	10.0	10.0
सूचनांचे पालन	6.4	5.8
कोडी सोडवणे	8.2	7.2
टूल कॉलिंग	3.0	10.0
सामान्य ज्ञान	3.0	10.0

GLM 5.1

Hamster playing table tennis

#66 GLM 5.1

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स