#89

GLM 5

Z.ai प्रकाशन: 2026-02-12 चाचणी तारीख: 2026-05-21 23:41 z-ai/glm-5::none

(medium) (none)

सारांश

GLM 5 AI BENCHY वर 6.3 स्कोर करते आणि #89 वर आहे. याची reliability 10.0, pass rate 46.7%, एकूण खर्च $0.023, आणि सरासरी response time 3.97s आहे.

GLM 5 खास का आहे: हे Samanya Buddhimatta मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर अँटी-एआय युक्त्या हा सर्वात कमकुवत भाग आहे, rank #13.

स्कोअर

6.3

सुसंगतता

9.7

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.023

एकूण आउटपुट टोकन्स

1,988

एकूण इनपुट टोकन्स

इनपुट किंमत

$0.600 / 1M

आउटपुट किंमत

$1.920 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 11

प्रति प्रयत्न पास दर: 46.7%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

3.97s

प्रतिसाद वेळ (कमाल): 11.07s

प्रतिसाद वेळ (एकूण): 51.65s

चुकीचे उत्तर: 11

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#89 GLM 5

none

खर्च: $0.007
वेळ: 32.1s
टोकन्स: 2,023 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:05 नवीन चाचणी जोडली	6.1	10.0	$0.027 ↑	तुलना करा
2026-05-21 23:41 सूट बदलला	6.3	10.0	$0.023	सध्याची रन
2026-04-22 12:55 पहिली नोंदलेली रन	6.6	लागू नाही	$0.020	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

GLM 5nonevsNemotron 3 Supermediumमोफत उपलब्ध GLM 5nonevsQwen3.5-35B-A3Bmedium GLM 5nonevsGPT-5.5none GLM 5nonevsGemini 3.1 Flash Litelow GLM 5nonevsGemini 3.5 Flashhigh GLM 5nonevsGemini 3 Flash Previewmedium GLM 5nonevsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध GLM 5nonevsGPT-5.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	4.8	10.0
कोडिंग	4.6	6.8
संयुक्त	3.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	3.0	10.0
Samanya Buddhimatta	10.0	10.0
सूचनांचे पालन	10.0	10.0
कोडी सोडवणे	7.7	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

GLM 5

Hamster playing table tennis

#89 GLM 5

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स