नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

DeepSeek: DeepSeek V3.2 vs StepFun: Step 3.5 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक DeepSeek V3.2 DeepSeek V3.2 medium रिलीज़: 2025-12-01 Step 3.5 Flash Step 3.5 Flash medium रिलीज़: 2026-02-01
स्कोर 8.0 7.9
रैंक #27 #30
संगति 8.2 9.1
सही परीक्षण
प्रति प्रयास पास दर 79.6% 70.6%
अस्थिर टेस्ट 4 2
कुल रन 54 49
प्रति परिणाम लागत 0.240 0.000
कुल लागत $0.029 $0.000
???? ??? $0.260 / 1M $0.100 / 1M
????? ??? $0.380 / 1M $0.300 / 1M
आउटपुट टोकन 10,620 71,904
रीजनिंग टोकन 48,511 155,607
प्रतिक्रिया समय (औसत) 46.41s 26.78s
प्रतिक्रिया समय (अधिकतम) 180.92s 170.45s
प्रतिक्रिया समय (कुल) 835.33s 294.58s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 8.4 9.9 75.0% 0 30.72s 3,773 7,523
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 4.7 1.6 66.7% 1 180.92s 626 6,792
Step 3.5 Flash - - - - - - - -
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 571 6,296
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 207 7,693
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 5.3 7.2 44.4% 1 39.32s 3,081 7,856
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 5.4 2.5 66.7% 1 31.30s 68 2,366
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 1,397 2,845
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 8.2 7.2 88.9% 1 36.87s 390 6,281
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 507 859
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

त्वरित तुलना

तुलना जोड़ी बदलें