नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

DeepSeek: DeepSeek V4 Flash vs Qwen: Qwen3.5-9B

सारांश

DeepSeek V4 Flash vs Qwen3.5-9B benchmark तुलना: DeepSeek V4 Flash average score में आगे है: 5.0 vs 4.2. DeepSeek V4 Flash की benchmark लागत कम है: $0.008 vs $0.035. DeepSeek V4 Flash तेज है: 26.75s vs 82.24s, pass rates 30.2% vs 27.0%.

अनुशंसित मॉडल: DeepSeek V4 Flash - It has the best score here (5.0), while costing about 4.6x less than Qwen3.5-9B.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-04

मेट्रिक DeepSeek V4 Flash DeepSeek V4 Flash none रिलीज़: 2026-04-24 Qwen3.5-9B Qwen3.5-9B medium रिलीज़: 2026-03-02
स्कोर 5.0 4.2
रैंक #139 #161
विश्वसनीयता 10.0 6.7
संगति 8.9 8.0
सही परीक्षण
प्रति प्रयास पास दर 30.2% 27.0%
अस्थिर टेस्ट 3 5
कुल रन 63 63
प्रति परिणाम लागत 0.203 1.187
कुल लागत $0.008 $0.035
इनपुट कीमत $0.099 / 1M $0.040 / 1M
आउटपुट कीमत $0.197 / 1M $0.150 / 1M
कुल इनपुट टोकन 50,127 17,070
आउटपुट टोकन 13,710 29,045
रीजनिंग टोकन 0 209,516
प्रतिक्रिया समय (औसत) 26.75s 82.24s
प्रतिक्रिया समय (अधिकतम) 111.96s 226.38s
प्रतिक्रिया समय (कुल) 561.82s 1315.88s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#139 DeepSeek V4 Flash

none
Cost
$0.004
Time
157.6s
Tokens
11,297 tok

#161 Qwen3.5-9B

medium
Cost
$0.001
Time
35.9s
Tokens
3,030 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 3.0 10.0 0.0% 0 20.18s 540 174 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 369 2,621 12,411
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 4.2 7.4 11.1% 1 17.13s 7,279 9,717 0
Qwen3.5-9B 2.9 10.0 0.0% 0 100.88s 2,396 7,890 41,129
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 4.5 2.1 66.7% 1 111.96s 24,398 2,664 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 10.0 10.0 100.0% 0 23.79s 7,290 195 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 4,722 1,383 32,113
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 5.3 10.0 33.3% 0 19.73s 666 18 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 295 11,549 48,475
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 4.2 9.9 0.0% 0 23.74s 471 67 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 180 0 30,695
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 6.5 10.0 50.0% 0 17.54s 627 321 0
Qwen3.5-9B 6.5 10.0 50.0% 0 5.75s 381 491 1,824
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 3.1 7.3 11.1% 1 23.72s 594 207 0
Qwen3.5-9B 3.0 10.0 0.0% 0 32.27s 376 1,593 12,026
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 10.0 10.0 100.0% 0 77.93s 8,079 327 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 8,283 444 1,149
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 3.0 10.0 0.0% 0 3.07s 183 20 0
Qwen3.5-9B 3.0 10.0 0.0% 0 177.02s 68 3,074 29,694

त्वरित तुलना

तुलना जोड़ी बदलें