नेव्हिगेशन
AI BENCHY
तुलना करा चार्ट्स Paddhati
❤️ Made by XCS
Your ad here

AI BENCHY Compare

StepFun: Step 3.5 Flash vs Z.ai: GLM 5

तुलना करा:

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-06

मेट्रिक StepFun: Step 3.5 Flash medium प्रकाशन: 2026-02-01 मोफत उपलब्ध Z.ai: GLM 5 medium प्रकाशन: 2026-02-12
क्रमांक #13 #14
सरासरी स्कोअर 7.4 7.4
सुसंगतता 9.1 8.0
प्रति निकाल खर्च 0.000 0.933
एकूण खर्च $0.000 $0.103
बरोबर चाचण्या
प्रति प्रयत्न पास दर 68.8% 83.3%
अस्थिर चाचण्या 2 4
एकूण रन 48 (16 x 3) 48 (16 x 3)
आउटपुट टोकन्स 71,452 19,773
रिझनिंग टोकन्स 155,147 36,459
प्रतिसाद वेळ (सरासरी) 29.10s 16.16s
प्रतिसाद वेळ (कमाल) 170.45s 28.96s
प्रतिसाद वेळ (एकूण) 290.96s 129.26s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 18.54s 13,924 17,208
Z.ai: GLM 5 10.0 10.0 100.0% 0 22.26s 420 4,992
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
Z.ai: GLM 5 10.0 10.0 100.0% 0 28.96s 662 3,242
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
Z.ai: GLM 5 5.0 5.6 83.3% 1 8.90s 567 3,734
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
StepFun: Step 3.5 Flash 4.0 7.2 44.4% 1 170.45s 45,350 90,436
Z.ai: GLM 5 10.0 4.4 33.3% 2 0ms 13,176 14,137
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
StepFun: Step 3.5 Flash 6.0 10.0 0.0% 0 6.54s 2,214 2,584
Z.ai: GLM 5 5.0 3.1 66.7% 1 14.69s 2,020 2,248
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
StepFun: Step 3.5 Flash 9.0 6.8 83.3% 1 4.98s 2,284 3,412
Z.ai: GLM 5 10.0 10.0 100.0% 0 7.25s 1,001 2,129
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
StepFun: Step 3.5 Flash 4.0 10.0 33.3% 0 7.72s 5,629 10,835
Z.ai: GLM 5 10.0 10.0 100.0% 0 15.64s 1,694 4,983
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802
Z.ai: GLM 5 10.0 10.0 100.0% 0 15.93s 233 994

झटपट तुलना

तुलना जोडी बदला