नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

DeepSeek: DeepSeek V4 Pro vs StepFun: Step 3.5 Flash

सारांश

DeepSeek V4 Pro vs Step 3.5 Flash benchmark तुलना: DeepSeek V4 Pro average score में आगे है: 7.2 vs 6.6. DeepSeek V4 Pro की benchmark लागत कम है: $0.034 vs $0.070. DeepSeek V4 Pro तेज है: 6.41s vs 72.53s, pass rates 52.4% vs 54.0%.

अनुशंसित मॉडल: DeepSeek V4 Pro - It has the best score here (7.2), while costing about 2.1x less than Step 3.5 Flash.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक DeepSeek V4 Pro DeepSeek V4 Pro none रिलीज़: 2026-04-24 Step 3.5 Flash Step 3.5 Flash medium रिलीज़: 2026-02-01
स्कोर 7.2 6.6
रैंक #58 #80
विश्वसनीयता 9.9 10.0
संगति 8.8 8.9
सही परीक्षण
प्रति प्रयास पास दर 52.4% 54.0%
अस्थिर टेस्ट 3 1
कुल रन 63 60
प्रति परिणाम लागत 0.333 0.198
कुल लागत $0.034 $0.070
इनपुट कीमत $0.435 / 1M $0.090 / 1M
आउटपुट कीमत $0.870 / 1M $0.300 / 1M
कुल इनपुट टोकन 53,558 34,431
आउटपुट टोकन 11,424 91,587
रीजनिंग टोकन 0 195,973
प्रतिक्रिया समय (औसत) 6.41s 72.53s
प्रतिक्रिया समय (अधिकतम) 30.09s 453.94s
प्रतिक्रिया समय (कुल) 134.66s 1015.47s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#58 DeepSeek V4 Pro

none
अमान्य SVG
लागत
$0.000
समय
300.0s
टोकन
0 tok

#80 Step 3.5 Flash

medium
लागत
$0.008
समय
277.1s
टोकन
23,695 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 3.2 6.1 16.7% 2 4.02s 540 1,168 0
Step 3.5 Flash 10.0 10.0 100.0% 0 40.57s 694 20,391 24,176
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 5.6 10.0 33.3% 0 13.38s 7,275 5,500 0
Step 3.5 Flash 2.4 5.2 0.0% 0 258.38s 2,211 13,207 22,429
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 9.5 10.0 100.0% 0 23.74s 27,529 2,235 0
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 13,638 1,176 12,984
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 10.0 10.0 100.0% 0 4.61s 7,568 200 0
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 7,368 600 13,886
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 5.3 10.0 33.3% 0 3.72s 666 24 0
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 673 45,350 90,436
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 5.0 10.0 0.0% 0 2.05s 471 126 0
Step 3.5 Flash 5.5 10.0 0.0% 0 22.39s 509 240 3,506
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 6.3 5.8 66.7% 1 4.12s 627 713 0
Step 3.5 Flash 8.3 10.0 50.0% 0 4.78s 705 2,364 3,521
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 10.0 10.0 100.0% 0 3.61s 594 442 0
Step 3.5 Flash 5.3 10.0 33.3% 0 7.22s 711 5,630 10,861
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 10.0 10.0 100.0% 0 7.40s 8,105 328 0
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 7,701 275 3,802
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 3.0 10.0 0.0% 0 5.76s 183 688 0
Step 3.5 Flash 3.0 10.0 0.0% 0 108.45s 221 2,354 10,372

त्वरित तुलना

तुलना जोड़ी बदलें