नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

StepFun: Step 3.5 Flash vs Z.ai: GLM 5V Turbo

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-02

मेट्रिक Step 3.5 Flash Step 3.5 Flash medium रिलीज़: 2026-02-01 निःशुल्क उपलब्ध GLM 5V Turbo GLM 5V Turbo medium रिलीज़: 2026-04-01
स्कोर 7.9 7.7
रैंक #27 #30
संगति 9.1 7.4
सही परीक्षण
प्रति प्रयास पास दर 70.6% 76.5%
अस्थिर टेस्ट 2 6
कुल रन 49 51
प्रति परिणाम लागत 0.000 2.697
कुल लागत $0.000 $0.270
???? ??? $0.100 / 1M $1.200 / 1M
????? ??? $0.300 / 1M $4.000 / 1M
आउटपुट टोकन 71,904 1,947
रीजनिंग टोकन 155,607 54,313
प्रतिक्रिया समय (औसत) 26.78s 15.03s
प्रतिक्रिया समय (अधिकतम) 170.45s 67.08s
प्रतिक्रिया समय (कुल) 294.58s 255.55s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
GLM 5V Turbo 7.2 6.1 75.0% 2 10.76s 587 7,872
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
GLM 5V Turbo 6.9 3.8 66.7% 1 15.06s 403 2,523
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
GLM 5V Turbo 10.0 10.0 100.0% 0 9.60s 236 4,333
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
GLM 5V Turbo 5.3 7.2 44.4% 1 38.15s 32 29,035
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
GLM 5V Turbo 10.0 10.0 100.0% 0 11.09s 131 2,183
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
GLM 5V Turbo 9.9 10.0 100.0% 0 3.74s 72 1,813
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
GLM 5V Turbo 7.7 7.3 77.8% 1 10.91s 193 5,789
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802
GLM 5V Turbo 7.0 3.7 66.7% 1 12.53s 293 765

त्वरित तुलना

तुलना जोड़ी बदलें