AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#104

GLM 5

Z.ai प्रकाशन: 2026-02-12 चाचणी तारीख: 2026-06-04 13:05 z-ai/glm-5::none
(medium) (none)

सारांश

GLM 5 AI BENCHY वर 6.0 स्कोर करते आणि #104 वर आहे. याची reliability 10.0, pass rate 44.4%, एकूण खर्च $0.027, आणि सरासरी response time 4.03s आहे.

GLM 5 खास का आहे: हे कोडी सोडवणे मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #2 आहे; तर कोडिंग हा सर्वात कमकुवत भाग आहे, rank #12.

सुसंगतता

9.7

एकूण खर्च (सध्याची किंमत)

$0.027 ↑ +10.5%

या किमतीवर चाचणी केली: $0.024

एकूण आउटपुट टोकन्स

1,989

एकूण इनपुट टोकन्स

37,135

इनपुट किंमत

$0.600 / 1M

आउटपुट किंमत

$1.920 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 12

प्रति प्रयत्न पास दर: 44.4%

अस्थिर चाचण्या

1

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

4.03s

प्रतिसाद वेळ (कमाल): 11.07s

प्रतिसाद वेळ (एकूण): 56.37s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#104 GLM 5

none
खर्च
$0.007
वेळ
32.1s
टोकन्स
2,023 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:05 नवीन चाचणी जोडली 6.1 10.0 $0.027 सध्याची रन
2026-05-21 23:41 सूट बदलला 6.3 10.0 $0.023 तुलना करा
2026-04-22 12:55 पहिली नोंदलेली रन 6.6 लागू नाही $0.020 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 13:05 · सध्याची रन6.09.710.09/2111,98937,135$0.0274.03s
2026-05-21 23:41 · सूट बदलला6.39.710.09/2011,9880$0.0233.97s
फरक-0.30.00.000+1+37135+$0.005+53ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.600 / 1M $1.920 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 4.8 10.0
कोडिंग 4.0 7.8
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 3.0 10.0
Samanya Buddhimatta 10.0 10.0
सूचनांचे पालन 10.0 10.0
कोडी सोडवणे 7.7 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स