नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

StepFun: Step 3.7 Flash vs Z.ai: GLM 5.1

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-29

मेट्रिक Step 3.7 Flash Step 3.7 Flash low रिलीज़: 2026-05-29 GLM 5.1 GLM 5.1 medium रिलीज़: 2026-04-07
स्कोर 7.4 7.4
रैंक #60 #56
विश्वसनीयता 10.0 5.0
संगति 8.7 8.3
सही परीक्षण
प्रति प्रयास पास दर 68.3% 71.7%
अस्थिर टेस्ट 3 4
कुल रन 60 60
प्रति परिणाम लागत 2.796 2.382
कुल लागत $0.336 $0.286
इनपुट कीमत $0.200 / 1M $0.980 / 1M
आउटपुट कीमत $1.150 / 1M $3.080 / 1M
आउटपुट टोकन 285,209 11,511
रीजनिंग टोकन 0 71,979
प्रतिक्रिया समय (औसत) 16.06s 33.45s
प्रतिक्रिया समय (अधिकतम) 124.75s 172.60s
प्रतिक्रिया समय (कुल) 321.11s 635.63s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 10,896 0
GLM 5.1 10.0 10.0 100.0% 0 8.31s 401 5,122
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 10.0 10.0 100.0% 0 9.43s 14,569 0
GLM 5.1 4.7 1.6 66.7% 2 145.56s 4,727 34,384
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 6,426 0
GLM 5.1 9.5 10.0 100.0% 0 43.11s 327 4,206
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 2,667 0
GLM 5.1 10.0 10.0 100.0% 0 9.33s 991 4,552
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 104,487 0
GLM 5.1 5.3 10.0 33.3% 0 29.77s 969 11,314
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 4,604 0
GLM 5.1 10.0 10.0 100.0% 0 20.95s 2,875 2,875
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 1,857 0
GLM 5.1 6.4 5.8 66.7% 1 7.47s 204 1,617
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 3,564 0
GLM 5.1 8.2 7.2 88.9% 1 31.64s 935 5,730
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 1,360 0
GLM 5.1 3.0 10.0 0.0% 0 0ms 0 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 134,779 0
GLM 5.1 3.0 10.0 0.0% 0 29.40s 82 2,179

त्वरित तुलना

तुलना जोड़ी बदलें