नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

StepFun: Step 3.7 Flash vs Xiaomi: MiMo-V2-Omni

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-29

मेट्रिक Step 3.7 Flash Step 3.7 Flash high रिलीज़: 2026-05-29 MiMo-V2-Omni MiMo-V2-Omni medium रिलीज़: 2026-03-18
स्कोर 7.1 6.9
रैंक #74 #81
विश्वसनीयता 10.0 10.0
संगति 8.2 8.7
सही परीक्षण
प्रति प्रयास पास दर 65.8% 58.3%
अस्थिर टेस्ट 4 3
कुल रन 60 52
प्रति परिणाम लागत 8.723 7.334
कुल लागत $0.960 $0.734
इनपुट कीमत $0.200 / 1M $0.400 / 1M
आउटपुट कीमत $1.150 / 1M $2.000 / 1M
आउटपुट टोकन 828,084 1,952
रीजनिंग टोकन 0 357,306
प्रतिक्रिया समय (औसत) 49.43s 41.16s
प्रतिक्रिया समय (अधिकतम) 192.75s 299.23s
प्रतिक्रिया समय (कुल) 988.58s 823.26s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 42,656 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.75s 269 1,701
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 3.6 4.6 25.0% 1 126.82s 164,069 0
MiMo-V2-Omni 3.4 4.8 16.7% 1 183.89s 292 174,314
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 8,802 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 25.87s 380 8,673
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 23,113 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 3.04s 155 591
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 410,502 0
MiMo-V2-Omni 3.0 10.0 0.0% 0 47.89s 155 68,398
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 2,862 0
MiMo-V2-Omni 5.4 2.5 66.7% 1 3.61s 136 492
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 2,010 0
MiMo-V2-Omni 8.3 10.0 50.0% 0 4.99s 49 515
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 25,422 0
MiMo-V2-Omni 5.9 7.2 55.6% 1 2.38s 210 860
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 1,172 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 13.98s 303 3,461
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 147,476 0
MiMo-V2-Omni 3.0 10.0 0.0% 0 234.19s 3 98,301

त्वरित तुलना

तुलना जोड़ी बदलें