#29

GLM 5 Turbo

Z.ai प्रकाशन: 2026-03-15 चाचणी तारीख: 2026-05-21 23:44 z-ai/glm-5-turbo::medium

(medium) (none)

सारांश

GLM 5 Turbo AI BENCHY वर 7.9 स्कोर करते आणि #29 वर आहे. याची reliability 8.3, pass rate 76.7%, एकूण खर्च $0.244, आणि सरासरी response time 22.69s आहे.

GLM 5 Turbo खास का आहे: या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे.

संग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.

स्कोअर

7.9

सुसंगतता

8.1

विश्वसनीयता

8.3

एकूण खर्च (सध्याची किंमत)

$0.244

एकूण आउटपुट टोकन्स

65,789

एकूण इनपुट टोकन्स

इनपुट किंमत

$1.200 / 1M

आउटपुट किंमत

$4.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 7

प्रति प्रयत्न पास दर: 76.7%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

22.69s

प्रतिसाद वेळ (कमाल): 194.23s

प्रतिसाद वेळ (एकूण): 453.72s

चुकीचे उत्तर: 4 सूचनांचे पालन केले नाही: 1 उत्तर नाही: 1 वेळ संपला: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#29 GLM 5 Turbo

medium

खर्च: $0.074
वेळ: 206.0s
टोकन्स: 18,549 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:06 पुन्हा चाचणी	7.6	10.0	$0.323 ↑	तुलना करा
2026-06-04 13:06 नवीन चाचणी जोडली	8.0	10.0	$0.323 ↑	तुलना करा
2026-05-21 23:44 सूट बदलला	7.9	8.3	$0.244	सध्याची रन
2026-04-11 01:19 पहिली नोंदलेली रन	8.1	लागू नाही	$0.182	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	10.0	10.0
कोडिंग	7.3	5.8
संयुक्त	10.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	2.9	4.4
Samanya Buddhimatta	6.1	3.1
सूचनांचे पालन	10.0	10.0
कोडी सोडवणे	8.7	7.9
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

GLM 5 Turbo

Hamster playing table tennis

#29 GLM 5 Turbo

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स