AI BENCHY
Advertise here
#162

GLM 4.7 Flash

Z.ai प्रकाशन: 2026-01-19 चाचणी तारीख: 2026-06-04 13:29 z-ai/glm-4.7-flash::medium
(medium) (none)

सारांश

GLM 4.7 Flash AI BENCHY वर 4.3 स्कोर करते आणि #162 वर आहे. याची reliability 6.7, pass rate 33.3%, एकूण खर्च $0.054, आणि सरासरी response time 35.10s आहे.

GLM 4.7 Flash खास का आहे: या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे.

सुसंगतता

6.8

एकूण आउटपुट टोकन्स

132,833

एकूण इनपुट टोकन्स

37,206

इनपुट किंमत

$0.060 / 1M

आउटपुट किंमत

$0.400 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 17

प्रति प्रयत्न पास दर: 33.3%

अस्थिर चाचण्या

8

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

35.10s

प्रतिसाद वेळ (कमाल): 174.55s

प्रतिसाद वेळ (एकूण): 456.24s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#162 GLM 4.7 Flash

medium
अवैध SVG
खर्च
$0.000
वेळ
186.2s
टोकन्स
12,112 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:29 नवीन चाचणी जोडली 4.4 6.7 $0.054 सध्याची रन
2026-05-21 23:50 सूट बदलला 4.5 8.3 $0.054 तुलना करा
2026-04-11 01:19 पहिली नोंदलेली रन 4.6 लागू नाही $0.046 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.060 / 1M $0.400 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 4.7 5.9
कोडिंग 3.2 7.4
संयुक्त 2.8 2.1
डेटा पार्सिंग आणि निष्कर्षण 6.3 10.0
डोमेन-विशिष्ट 3.5 4.4
Samanya Buddhimatta 3.6 9.7
सूचनांचे पालन 6.2 5.8
कोडी सोडवणे 2.9 7.2
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स