नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

DeepSeek: DeepSeek V3.2 vs Qwen: Qwen3.5-9B

सारांश

DeepSeek V3.2 vs Qwen3.5-9B benchmark तुलना: DeepSeek V3.2 average score में आगे है: 5.3 vs 3.8. DeepSeek V3.2 की benchmark लागत कम है: $0.017 vs $0.036. DeepSeek V3.2 तेज है: 13.83s vs 82.24s, pass rates 39.7% vs 27.0%.

अनुशंसित मॉडल: DeepSeek V3.2 - It has the best score here (5.3), while costing about 2.1x less than Qwen3.5-9B.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक DeepSeek V3.2 DeepSeek V3.2 none रिलीज़: 2025-12-01 Qwen3.5-9B Qwen3.5-9B medium रिलीज़: 2026-03-02
स्कोर 5.3 3.8
रैंक #126 #165
विश्वसनीयता 10.0 6.7
संगति 7.6 8.0
सही परीक्षण
प्रति प्रयास पास दर 39.7% 27.0%
अस्थिर टेस्ट 6 5
कुल रन 63 63
प्रति परिणाम लागत 0.306 1.187
कुल लागत $0.017 $0.036
इनपुट कीमत $0.229 / 1M $0.100 / 1M
आउटपुट कीमत $0.344 / 1M $0.150 / 1M
कुल इनपुट टोकन 55,997 17,070
आउटपुट टोकन 11,165 29,045
रीजनिंग टोकन 0 209,516
प्रतिक्रिया समय (औसत) 13.83s 82.24s
प्रतिक्रिया समय (अधिकतम) 115.89s 226.38s
प्रतिक्रिया समय (कुल) 290.43s 1315.88s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#126 DeepSeek V3.2

none
लागत
$0.002
समय
7.0s
टोकन
1,046 tok

#165 Qwen3.5-9B

medium
लागत
$0.001
समय
35.9s
टोकन
3,030 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 3.2 8.0 8.3% 1 9.35s 494 1,073 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 369 2,621 12,411
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 3.1 6.9 11.1% 1 14.54s 7,279 4,528 0
Qwen3.5-9B 2.9 10.0 0.0% 0 100.88s 2,396 7,890 41,129
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 29,843 2,887 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 7,890 1,710 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 4,722 1,383 32,113
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 2.9 7.2 11.1% 1 4.17s 624 21 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 295 11,549 48,475
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 4.7 1.6 66.7% 1 9.32s 314 43 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 180 0 30,695
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 627 66 0
Qwen3.5-9B 6.5 10.0 50.0% 0 5.75s 381 491 1,824
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 7.6 7.2 77.8% 1 6.91s 424 298 0
Qwen3.5-9B 3.0 10.0 0.0% 0 32.27s 376 1,593 12,026
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 8,319 522 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 8,283 444 1,149
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 3.0 10.0 0.0% 0 17.23s 183 17 0
Qwen3.5-9B 3.0 10.0 0.0% 0 177.02s 68 3,074 29,694

त्वरित तुलना

तुलना जोड़ी बदलें