नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

StepFun: Step 3.5 Flash vs Xiaomi: MiMo-V2.5

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-22

मेट्रिक Step 3.5 Flash Step 3.5 Flash medium रिलीज़: 2026-02-01 MiMo-V2.5 MiMo-V2.5 medium रिलीज़: 2026-04-22
स्कोर 7.9 7.8
रैंक #31 #35
संगति 9.1 8.6
सही परीक्षण
प्रति प्रयास पास दर 70.6% 74.1%
अस्थिर टेस्ट 2 3
कुल रन 49 54
प्रति परिणाम लागत 0.000 2.102
कुल लागत $0.000 $0.253
???? ??? $0.100 / 1M $0.400 / 1M
????? ??? $0.300 / 1M $2.000 / 1M
आउटपुट टोकन 71,904 2,840
रीजनिंग टोकन 155,607 116,242
प्रतिक्रिया समय (औसत) 26.78s 13.71s
प्रतिक्रिया समय (अधिकतम) 170.45s 86.93s
प्रतिक्रिया समय (कुल) 294.58s 246.73s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
MiMo-V2.5 10.0 10.0 100.0% 0 1.98s 303 2,022
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
MiMo-V2.5 3.8 2.5 33.3% 1 1.55s 118 170
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash - - - - - - - -
MiMo-V2.5 10.0 10.0 100.0% 0 31.48s 488 14,813

त्वरित तुलना

तुलना जोड़ी बदलें