नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

StepFun: Step 3.5 Flash vs Z.ai: GLM 5 Turbo

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-15

मेट्रिक Step 3.5 Flash Step 3.5 Flash medium प्रकाशन: 2026-02-01 मोफत उपलब्ध GLM 5 Turbo GLM 5 Turbo medium प्रकाशन: 2026-03-15
क्रमांक #25 #20
स्कोअर 7.8 7.9
सुसंगतता 9.1 7.7
प्रति निकाल खर्च 0.000 1.641
एकूण खर्च $0.000 $0.165
बरोबर चाचण्या
प्रति प्रयत्न पास दर 68.8% 75.0%
अस्थिर चाचण्या 2 5
एकूण रन 48 48
आउटपुट टोकन्स 71,452 11,853
रिझनिंग टोकन्स 155,147 35,095
प्रतिसाद वेळ (सरासरी) 29.10s 18.84s
प्रतिसाद वेळ (कमाल) 170.45s 194.23s
प्रतिसाद वेळ (एकूण) 290.96s 301.50s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 10.0 10.0 100.0% 0 18.54s 13,924 17,208
GLM 5 Turbo 10.0 10.0 100.0% 0 5.01s 350 2,600
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
GLM 5 Turbo 10.0 10.0 100.0% 0 13.88s 390 2,037
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
GLM 5 Turbo 10.0 10.0 100.0% 0 6.19s 577 3,632
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
GLM 5 Turbo 2.9 4.4 22.2% 2 71.07s 9,665 19,279
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
GLM 5 Turbo 6.1 3.1 66.7% 1 10.05s 60 2,216
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
GLM 5 Turbo 10.0 10.0 100.0% 0 5.38s 255 2,183
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
GLM 5 Turbo 7.3 5.8 55.6% 2 5.44s 315 2,702
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802
GLM 5 Turbo 10.0 10.0 100.0% 0 9.84s 241 446

झटपट तुलना

तुलना जोडी बदला