#101

GLM 5.1

Z.ai प्रकाशन: 2026-04-07 चाचणी तारीख: 2026-05-08 13:04 z-ai/glm-5.1::none

(medium) (none)

सारांश

GLM 5.1 AI BENCHY वर 5.7 स्कोर करते आणि #101 वर आहे. याची reliability 10.0, pass rate 42.1%, एकूण खर्च $0.053, आणि सरासरी response time 4.23s आहे.

स्कोअर

5.7

सुसंगतता

8.0

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.053

एकूण आउटपुट टोकन्स

3,731

एकूण इनपुट टोकन्स

इनपुट किंमत

$1.050 / 1M

आउटपुट किंमत

$3.500 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 13

प्रति प्रयत्न पास दर: 42.1%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

4.23s

प्रतिसाद वेळ (कमाल): 32.57s

प्रतिसाद वेळ (एकूण): 80.36s

चुकीचे उत्तर: 11 सूचनांचे पालन केले नाही: 1 अवैध टूल कॉल: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#101 GLM 5.1

none

अवैध SVG

खर्च: $0.000
वेळ: 300.0s
टोकन्स: 0 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:04 नवीन चाचणी जोडली	5.7	10.0	$0.058 ↓	तुलना करा
2026-05-21 23:41 सूट बदलला	5.6	10.0	$0.057	तुलना करा
2026-05-08 13:04 सूट बदलला	5.7	10.0	$0.053	सध्याची रन
2026-05-08 13:04 सूट बदलला	5.7	10.0	$0.053	तुलना करा
2026-04-22 12:55 पहिली नोंदलेली रन	5.6	लागू नाही	$0.053	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-05-08 13:04 · सूट बदलला	5.7	8.0	10.0	6/19	5	3,731	$0.053	4.23s
2026-04-22 12:55 · पहिली नोंदलेली रन	5.6	8.2	लागू नाही	5/18	4	3,720	$0.053	4.33s
फरक	+0.1	-0.2		+1	+1	+11	+$0.001	-105ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

GLM 5.1nonevsGemini 3.1 Flash Litenone GLM 5.1nonevsGemma 4 31Bnoneमोफत उपलब्ध GLM 5.1nonevsNemotron 3 Ultra 550b A55bnoneमोफत उपलब्ध GLM 5.1nonevsGemini 3.1 Flash Liteminimal GLM 5.1nonevsQwen3.6 Max Previewnone GLM 5.1nonevsGemini 3.5 Flashhigh GLM 5.1nonevsGemini 3 Flash Previewmedium GLM 5.1nonevsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध GLM 5.1nonevsGPT-5.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	4.0	6.3
कोडिंग	5.1	9.1
संयुक्त	2.8	2.1
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	2.9	7.2
Samanya Buddhimatta	5.0	10.0
सूचनांचे पालन	9.8	10.0
कोडी सोडवणे	6.1	7.8
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

GLM 5.1

Hamster playing table tennis

#101 GLM 5.1

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स