नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

StepFun: Step 3.7 Flash vs Xiaomi: MiMo-V2.5-Pro

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-29

मेट्रिक Step 3.7 Flash Step 3.7 Flash low रिलीज़: 2026-05-29 MiMo-V2.5-Pro MiMo-V2.5-Pro medium रिलीज़: 2026-04-22
स्कोर 7.4 7.6
रैंक #60 #48
विश्वसनीयता 10.0 10.0
संगति 8.7 8.9
सही परीक्षण
प्रति प्रयास पास दर 68.3% 68.3%
अस्थिर टेस्ट 3 3
कुल रन 60 60
प्रति परिणाम लागत 2.796 2.408
कुल लागत $0.336 $0.289
इनपुट कीमत $0.200 / 1M $0.435 / 1M
आउटपुट कीमत $1.150 / 1M $0.870 / 1M
आउटपुट टोकन 285,209 5,004
रीजनिंग टोकन 0 80,295
प्रतिक्रिया समय (औसत) 16.06s 21.79s
प्रतिक्रिया समय (अधिकतम) 124.75s 130.77s
प्रतिक्रिया समय (कुल) 321.11s 435.79s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 10,896 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.26s 323 1,179
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 10.0 10.0 100.0% 0 9.43s 14,569 0
MiMo-V2.5-Pro 7.0 6.2 66.7% 1 81.67s 769 33,771
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 6,426 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 348 11,870
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 2,667 0
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 260 8,383
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 104,487 0
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 275 17,023
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 4,604 0
MiMo-V2.5-Pro 5.5 10.0 0.0% 0 4.02s 155 163
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 1,857 0
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 82 803
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 3,564 0
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.31s 540 2,181
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 1,360 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 311 2,908
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 134,779 0
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 12.46s 1,941 2,014

त्वरित तुलना

तुलना जोड़ी बदलें