नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

StepFun: Step 3.5 Flash vs Xiaomi: MiMo-V2-Pro

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-20

मेट्रिक Step 3.5 Flash Step 3.5 Flash medium प्रकाशन: 2026-02-01 मोफत उपलब्ध MiMo-V2-Pro MiMo-V2-Pro none प्रकाशन: 2026-03-18
स्कोअर 7.9 5.8
क्रमांक #23 #54
सुसंगतता 9.1 8.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 70.6% 45.1%
अस्थिर चाचण्या 2 3
एकूण रन 49 51
प्रति निकाल खर्च 0.000 0.659
एकूण खर्च $0.000 $0.040
???? ??? $0.100 / 1M $1.000 / 1M
????? ??? $0.300 / 1M $3.000 / 1M
आउटपुट टोकन्स 71,904 1,721
रिझनिंग टोकन्स 155,607 0
प्रतिसाद वेळ (सरासरी) 26.78s 2.31s
प्रतिसाद वेळ (कमाल) 170.45s 6.58s
प्रतिसाद वेळ (एकूण) 294.58s 39.25s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
MiMo-V2-Pro 3.5 8.0 16.7% 1 1.80s 315 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
MiMo-V2-Pro 3.0 10.0 0.0% 0 6.58s 333 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
MiMo-V2-Pro 10.0 10.0 100.0% 0 1.39s 249 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
MiMo-V2-Pro 5.3 7.2 44.4% 1 1.78s 26 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
MiMo-V2-Pro 4.3 9.9 0.0% 0 2.44s 125 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
MiMo-V2-Pro 6.5 10.0 50.0% 0 2.51s 69 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
MiMo-V2-Pro 6.0 7.1 55.6% 1 1.83s 327 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802
MiMo-V2-Pro 10.0 10.0 100.0% 0 4.39s 277 0

झटपट तुलना

तुलना जोडी बदला