नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

StepFun: Step 3.5 Flash vs Xiaomi: MiMo-V2-Pro

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-20

मेट्रिक Step 3.5 Flash Step 3.5 Flash medium रिलीज़: 2026-02-01 निःशुल्क उपलब्ध MiMo-V2-Pro MiMo-V2-Pro medium रिलीज़: 2026-03-18
स्कोर 7.9 8.0
रैंक #23 #20
संगति 9.1 8.5
सही परीक्षण
प्रति प्रयास पास दर 70.6% 76.5%
अस्थिर टेस्ट 2 3
कुल रन 49 45
प्रति परिणाम लागत 0.000 1.110
कुल लागत $0.000 $0.123
???? ??? $0.100 / 1M $1.000 / 1M
????? ??? $0.300 / 1M $3.000 / 1M
आउटपुट टोकन 71,904 1,875
रीजनिंग टोकन 155,607 26,959
प्रतिक्रिया समय (औसत) 26.78s 9.78s
प्रतिक्रिया समय (अधिकतम) 170.45s 64.71s
प्रतिक्रिया समय (कुल) 294.58s 156.45s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
MiMo-V2-Pro 10.0 10.0 100.0% 0 3.06s 223 1,107
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
MiMo-V2-Pro 4.7 1.6 66.7% 1 64.71s 380 14,186
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
MiMo-V2-Pro 7.3 5.8 83.3% 1 17.20s 260 7,484
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
MiMo-V2-Pro 5.3 10.0 33.3% 0 6.00s 155 1,048
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
MiMo-V2-Pro 10.0 10.0 100.0% 0 4.06s 198 424
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
MiMo-V2-Pro 9.9 10.0 100.0% 0 3.36s 83 667
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
MiMo-V2-Pro 7.0 7.2 55.6% 1 4.71s 313 1,179
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802
MiMo-V2-Pro 10.0 10.0 100.0% 0 8.19s 263 864

त्वरित तुलना

तुलना जोड़ी बदलें