नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

StepFun: Step 3.7 Flash vs Xiaomi: MiMo-V2.5-Pro

सारांश

Step 3.7 Flash vs MiMo-V2.5-Pro benchmark तुलना: MiMo-V2.5-Pro average score में आगे है: 7.5 vs 7.0. MiMo-V2.5-Pro की benchmark लागत कम है: $0.106 vs $1.148. MiMo-V2.5-Pro तेज है: 26.13s vs 64.46s, pass rates 63.5% vs 68.3%.

अनुशंसित मॉडल: MiMo-V2.5-Pro - It has the best score here (7.5), while costing about 10.9x less than Step 3.7 Flash.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-04

मेट्रिक Step 3.7 Flash Step 3.7 Flash high रिलीज़: 2026-05-29 MiMo-V2.5-Pro MiMo-V2.5-Pro medium रिलीज़: 2026-04-22
स्कोर 7.0 7.5
रैंक #71 #43
विश्वसनीयता 10.0 10.0
संगति 8.2 8.5
सही परीक्षण
प्रति प्रयास पास दर 63.5% 68.3%
अस्थिर टेस्ट 4 4
कुल रन 63 63
प्रति परिणाम लागत 10.434 2.541
कुल लागत $1.148 $0.106
इनपुट कीमत $0.200 / 1M $0.435 / 1M
आउटपुट कीमत $1.150 / 1M $0.870 / 1M
कुल इनपुट टोकन 38,391 40,854
आउटपुट टोकन 991,355 5,015
रीजनिंग टोकन 0 97,742
प्रतिक्रिया समय (औसत) 64.46s 26.13s
प्रतिक्रिया समय (अधिकतम) 364.99s 130.77s
प्रतिक्रिया समय (कुल) 1353.57s 548.65s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#71 Step 3.7 Flash

high
Cost
$0.007
Time
63.6s
Tokens
6,030 tok

#43 MiMo-V2.5-Pro

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.26s 621 323 1,179
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
MiMo-V2.5-Pro 6.2 4.7 66.7% 2 92.07s 6,543 780 51,218
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 15,060 348 11,870
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 7,746 260 8,383
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 630 275 17,023
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
MiMo-V2.5-Pro 5.5 10.0 0.0% 0 4.02s 492 155 163
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 672 82 803
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.31s 660 540 2,181
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 8,220 311 2,908
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 12.46s 210 1,941 2,014

त्वरित तुलना

तुलना जोड़ी बदलें