#104

GLM 5

Z.ai प्रकाशन: 2026-02-12 चाचणी तारीख: 2026-06-04 13:05 z-ai/glm-5::none

(medium) (none)

सारांश

GLM 5 AI BENCHY वर 6.0 स्कोर करते आणि #104 वर आहे. याची reliability 10.0, pass rate 44.4%, एकूण खर्च $0.027, आणि सरासरी response time 4.03s आहे.

GLM 5 खास का आहे: हे कोडी सोडवणे मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #2 आहे; तर कोडिंग हा सर्वात कमकुवत भाग आहे, rank #12.

स्कोअर

6.0

सुसंगतता

9.7

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.027 ↑ +10.5%

या किमतीवर चाचणी केली: $0.024

एकूण आउटपुट टोकन्स

1,989

एकूण इनपुट टोकन्स

37,135

इनपुट किंमत

$0.600 / 1M

आउटपुट किंमत

$1.920 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 12

प्रति प्रयत्न पास दर: 44.4%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

4.03s

प्रतिसाद वेळ (कमाल): 11.07s

प्रतिसाद वेळ (एकूण): 56.37s

चुकीचे उत्तर: 12

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#104 GLM 5

none

खर्च: $0.007
वेळ: 32.1s
टोकन्स: 2,023 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:05 नवीन चाचणी जोडली	6.1	10.0	$0.027 ↑	सध्याची रन
2026-05-21 23:41 सूट बदलला	6.3	10.0	$0.023	तुलना करा
2026-04-22 12:55 पहिली नोंदलेली रन	6.6	लागू नाही	$0.020	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण इनपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-06-04 13:05 · सध्याची रन	6.0	9.7	10.0	9/21	1	1,989	37,135	$0.027	4.03s
2026-05-21 23:41 · सूट बदलला	6.3	9.7	10.0	9/20	1	1,988	0	$0.023	3.97s
फरक	-0.3	0.0	0.0	0	0	+1	+37135	+$0.005	+53ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख	इनपुट किंमत	आउटपुट किंमत
2026-06-04 15:40	$0.600 / 1M	$1.920 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

GLM 5nonevsNemotron 3 Supermediumमोफत उपलब्ध GLM 5nonevsQwen3.5-35B-A3Bmedium GLM 5nonevsGPT-5.5none GLM 5nonevsGemini 3.1 Flash Litelow GLM 5nonevsGemini 3.5 Flashhigh GLM 5nonevsGemini 3 Flash Previewmedium GLM 5nonevsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध GLM 5nonevsGPT-5.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	4.8	10.0
कोडिंग	4.0	7.8
संयुक्त	3.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	3.0	10.0
Samanya Buddhimatta	10.0	10.0
सूचनांचे पालन	10.0	10.0
कोडी सोडवणे	7.7	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

GLM 5

Hamster playing table tennis

#104 GLM 5

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स