नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Mini vs StepFun: Step 3.7 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-29

मेट्रिक Seed-2.0-Mini Seed-2.0-Mini medium रिलीज़: 2026-02-14 Step 3.7 Flash Step 3.7 Flash high रिलीज़: 2026-05-29
स्कोर 7.1 7.1
रैंक #75 #74
विश्वसनीयता 10.0 10.0
संगति 9.2 8.2
सही परीक्षण
प्रति प्रयास पास दर 60.0% 65.8%
अस्थिर टेस्ट 2 4
कुल रन 60 60
प्रति परिणाम लागत 0.397 8.723
कुल लागत $0.044 $0.960
इनपुट कीमत $0.100 / 1M $0.200 / 1M
आउटपुट कीमत $0.400 / 1M $1.150 / 1M
आउटपुट टोकन 2,555 828,084
रीजनिंग टोकन 95,974 0
प्रतिक्रिया समय (औसत) 80.22s 49.43s
प्रतिक्रिया समय (अधिकतम) 262.83s 192.75s
प्रतिक्रिया समय (कुल) 1363.72s 988.58s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 360 9,520
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 42,656 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 7.1 9.8 50.0% 0 220.48s 464 34,964
Step 3.7 Flash 3.6 4.6 25.0% 1 126.82s 164,069 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 8,802 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 246 2,743
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 23,113 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 410,502 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 213 4,210
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 2,862 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 2,010 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 8.2 7.2 88.9% 1 31.79s 527 5,667
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 25,422 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 1,172 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 50 1,779
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 147,476 0

त्वरित तुलना

तुलना जोड़ी बदलें