नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

StepFun: Step 3.5 Flash vs Xiaomi: MiMo-V2.5

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-22

मेट्रिक Step 3.5 Flash Step 3.5 Flash medium प्रकाशन: 2026-02-01 MiMo-V2.5 MiMo-V2.5 medium प्रकाशन: 2026-04-22
स्कोअर 7.9 7.8
क्रमांक #31 #35
सुसंगतता 9.1 8.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 70.6% 74.1%
अस्थिर चाचण्या 2 3
एकूण रन 49 54
प्रति निकाल खर्च 0.000 2.102
एकूण खर्च $0.000 $0.253
???? ??? $0.100 / 1M $0.400 / 1M
????? ??? $0.300 / 1M $2.000 / 1M
आउटपुट टोकन्स 71,904 2,840
रिझनिंग टोकन्स 155,607 116,242
प्रतिसाद वेळ (सरासरी) 26.78s 13.71s
प्रतिसाद वेळ (कमाल) 170.45s 86.93s
प्रतिसाद वेळ (एकूण) 294.58s 246.73s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
MiMo-V2.5 10.0 10.0 100.0% 0 1.98s 303 2,022
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
MiMo-V2.5 3.8 2.5 33.3% 1 1.55s 118 170
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.5 Flash - - - - - - - -
MiMo-V2.5 10.0 10.0 100.0% 0 31.48s 488 14,813

झटपट तुलना

तुलना जोडी बदला