AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#162

GLM 4.7 Flash

Z.ai प्रकाशन: 2026-01-19 चाचणी तारीख: 2026-06-04 13:29 z-ai/glm-4.7-flash::medium
(medium) (none)

सारांश

GLM 4.7 Flash AI BENCHY वर 4.3 स्कोर करते आणि #162 वर आहे. याची reliability 6.7, pass rate 33.3%, एकूण खर्च $0.054, आणि सरासरी response time 35.10s आहे.

GLM 4.7 Flash खास का आहे: या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे.

सुसंगतता

6.8

एकूण आउटपुट टोकन्स

132,833

एकूण इनपुट टोकन्स

37,206

इनपुट किंमत

$0.060 / 1M

आउटपुट किंमत

$0.400 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 17

प्रति प्रयत्न पास दर: 33.3%

अस्थिर चाचण्या

8

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

35.10s

प्रतिसाद वेळ (कमाल): 174.55s

प्रतिसाद वेळ (एकूण): 456.24s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#162 GLM 4.7 Flash

medium
अवैध SVG
खर्च
$0.000
वेळ
186.2s
टोकन्स
12,112 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:29 नवीन चाचणी जोडली 4.4 6.7 $0.054 सध्याची रन
2026-05-21 23:50 सूट बदलला 4.5 8.3 $0.054 तुलना करा
2026-04-11 01:19 पहिली नोंदलेली रन 4.6 लागू नाही $0.046 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 13:29 · सध्याची रन4.36.86.74/218132,83337,206$0.05435.10s
2026-04-11 01:19 · पहिली नोंदलेली रन4.66.3लागू नाही4/188112,0890$0.04632.33s
फरक-0.3+0.500+20744+37206+$0.009+2764ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.060 / 1M $0.400 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 4.7 5.9
कोडिंग 3.2 7.4
संयुक्त 2.8 2.1
डेटा पार्सिंग आणि निष्कर्षण 6.3 10.0
डोमेन-विशिष्ट 3.5 4.4
Samanya Buddhimatta 3.6 9.7
सूचनांचे पालन 6.2 5.8
कोडी सोडवणे 2.9 7.2
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स