नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

StepFun: Step 3.5 Flash vs Z.ai: GLM 5 Turbo

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-15

मेट्रिक Step 3.5 Flash Step 3.5 Flash medium प्रकाशन: 2026-02-01 मोफत उपलब्ध GLM 5 Turbo GLM 5 Turbo none प्रकाशन: 2026-03-15
क्रमांक #25 #53
स्कोअर 7.8 5.7
सुसंगतता 9.1 9.5
प्रति निकाल खर्च 0.000 0.467
एकूण खर्च $0.000 $0.028
बरोबर चाचण्या
प्रति प्रयत्न पास दर 68.8% 39.6%
अस्थिर चाचण्या 2 1
एकूण रन 48 48
आउटपुट टोकन्स 71,452 1,264
रिझनिंग टोकन्स 155,147 0
प्रतिसाद वेळ (सरासरी) 29.10s 2.92s
प्रतिसाद वेळ (कमाल) 170.45s 8.21s
प्रतिसाद वेळ (एकूण) 290.96s 46.72s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 10.0 10.0 100.0% 0 18.54s 13,924 17,208
GLM 5 Turbo 3.0 10.0 0.0% 0 3.01s 376 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
GLM 5 Turbo 3.0 10.0 0.0% 0 4.89s 144 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
GLM 5 Turbo 10.0 10.0 100.0% 0 2.47s 204 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
GLM 5 Turbo 5.3 10.0 33.3% 0 1.97s 25 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
GLM 5 Turbo 4.2 9.9 0.0% 0 2.18s 48 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
GLM 5 Turbo 6.5 10.0 50.0% 0 2.13s 65 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
GLM 5 Turbo 5.5 7.4 44.4% 1 2.43s 180 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802
GLM 5 Turbo 10.0 10.0 100.0% 0 8.21s 222 0

झटपट तुलना

तुलना जोडी बदला