AI BENCHY
Advertise here
#105

GLM 5V Turbo

Z.ai रिलीज़: 2026-04-01 परीक्षण किया गया: 2026-06-04 13:05 z-ai/glm-5v-turbo::none
(medium) (none)

सारांश

GLM 5V Turbo AI BENCHY पर 5.9 स्कोर करता है और #105 पर है। इसकी reliability 10.0, pass rate 38.1%, कुल लागत $0.052, और औसत response time 2.99s है।

संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।

संगति

10.0

कुल आउटपुट टोकन

1,766

कुल इनपुट टोकन

37,100

इनपुट कीमत

$1.200 / 1M

आउटपुट कीमत

$4.000 / 1M

सही परीक्षण

गलत टेस्ट: 13

प्रति प्रयास पास दर: 38.1%

अस्थिर टेस्ट

0

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

2.99s

प्रतिक्रिया समय (अधिकतम): 6.51s

प्रतिक्रिया समय (कुल): 62.74s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#105 GLM 5V Turbo

none
लागत
$0.042
समय
177.3s
टोकन
10,434 tok

रन इतिहास

परीक्षण किया गया स्कोर विश्वसनीयता सही परीक्षण कुल लागत तुलना करें
2026-06-04 13:05 नया टेस्ट जोड़ा गया 5.8 10.0 $0.052 वर्तमान रन
2026-05-21 23:41 सूट बदला गया 5.9 10.0 $0.049 तुलना करें
2026-04-11 01:19 पहला दर्ज रन 6.2 लागू नहीं $0.044 तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रनस्कोरसंगतिविश्वसनीयतासही परीक्षणअस्थिर टेस्टकुल आउटपुट टोकनकुल इनपुट टोकनकुल लागतप्रतिक्रिया समय (औसत)
2026-06-04 13:05 · वर्तमान रन5.910.010.08/2101,76637,100$0.0522.99s
2026-04-11 01:19 · पहला दर्ज रन6.210.0लागू नहीं8/1801,7240$0.0443.10s
अंतर-0.30.000+42+37100+$0.009-116ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख इनपुट कीमत आउटपुट कीमत
2026-06-04 15:40 $1.200 / 1M $4.000 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

श्रेणी स्कोर संगति सही परीक्षण
एंटी-एआई ट्रिक्स 4.8 10.0
कोडिंग 5.5 10.0
संयुक्त 3.0 10.0
डेटा पार्सिंग और निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 5.3 10.0
Samanya Buddhimatta 4.6 10.0
निर्देश पालन 6.5 10.0
पहेली समाधान 5.3 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना किए गए मॉडल