#102

GLM 4.7 Flash

Z.ai प्रकाशन: 2026-01-19 चाचणी तारीख: 2026-04-11 01:19 z-ai/glm-4.7-flash::medium

(medium) (none)

सारांश

GLM 4.7 Flash AI BENCHY वर 4.6 स्कोर करते आणि #102 वर आहे. याची reliability लागू नाही, pass rate 38.9%, एकूण खर्च $0.046, आणि सरासरी response time 32.33s आहे.

GLM 4.7 Flash खास का आहे: हे असामान्यपणे जास्त reasoning tokens वापरते, ज्यामुळे runs हळू किंवा महाग होऊ शकतात.

स्कोअर

4.6

सुसंगतता

6.3

विश्वसनीयता

लागू नाही

एकूण खर्च (सध्याची किंमत)

$0.046

एकूण आउटपुट टोकन्स

112,089

एकूण इनपुट टोकन्स

इनपुट किंमत

$0.060 / 1M

आउटपुट किंमत

$0.400 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 14

प्रति प्रयत्न पास दर: 38.9%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

32.33s

प्रतिसाद वेळ (कमाल): 174.55s

प्रतिसाद वेळ (एकूण): 355.65s

चुकीचे उत्तर: 8 सूचनांचे पालन केले नाही: 2 उत्तर नाही: 2 अवैध टूल कॉल: 1 वेळ संपला: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#102 GLM 4.7 Flash

medium

अवैध SVG

खर्च: $0.000
वेळ: 186.2s
टोकन्स: 12,112 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:29 नवीन चाचणी जोडली	4.4	6.7	$0.054	तुलना करा
2026-05-21 23:50 सूट बदलला	4.5	8.3	$0.054	तुलना करा
2026-04-11 01:19 पहिली नोंदलेली रन	4.6	लागू नाही	$0.046	सध्याची रन

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण इनपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-04-11 01:19 · पहिली नोंदलेली रन	4.6	6.3	लागू नाही	4/18	8	112,089	0	$0.046	32.33s
2026-06-04 13:29 · नवीन चाचणी जोडली	4.4	6.8	6.7	4/21	8	132,833	37,206	$0.054	35.10s
फरक	+0.2	-0.5		0	0	-20744	-37206	-$0.009	-2764ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

GLM 4.7 FlashmediumvsDeepSeek V3.2none GLM 4.7 FlashmediumvsQwen3.6 35B A3Bnone GLM 4.7 FlashmediumvsQwen3.5-122B-A10Bnone GLM 4.7 FlashmediumvsMistral Small 4none GLM 4.7 FlashmediumvsGPT-5.4 Mininone GLM 4.7 FlashmediumvsQwen3 Coder Nextnone GLM 4.7 FlashmediumvsGemini 3.5 Flashhigh GLM 4.7 FlashmediumvsGemini 3 Flash Previewmedium GLM 4.7 FlashmediumvsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध GLM 4.7 FlashmediumvsGPT-5.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	4.7	5.9
कोडिंग	3.6	2.1
संयुक्त	2.8	2.1
डेटा पार्सिंग आणि निष्कर्षण	6.3	10.0
डोमेन-विशिष्ट	3.5	4.4
Samanya Buddhimatta	3.6	9.7
सूचनांचे पालन	6.2	5.8
कोडी सोडवणे	2.9	7.2
टूल कॉलिंग	10.0	10.0

GLM 4.7 Flash

Hamster playing table tennis

#102 GLM 4.7 Flash

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स