नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

DeepSeek: DeepSeek V4 Pro vs Qwen: Qwen3.5-Flash

सारांश

DeepSeek V4 Pro vs Qwen3.5-Flash benchmark तुलना: DeepSeek V4 Pro average score में आगे है: 7.2 vs 6.8. DeepSeek V4 Pro की benchmark लागत कम है: $0.034 vs $0.080. DeepSeek V4 Pro तेज है: 6.41s vs 63.29s, pass rates 52.4% vs 71.4%.

अनुशंसित मॉडल: DeepSeek V4 Pro - It has the best score here (7.2), while costing about 2.4x less than Qwen3.5-Flash.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक DeepSeek V4 Pro DeepSeek V4 Pro none रिलीज़: 2026-04-24 Qwen3.5-Flash Qwen3.5-Flash medium रिलीज़: 2026-02-24
स्कोर 7.2 6.8
रैंक #58 #70
विश्वसनीयता 9.9 10.0
संगति 8.8 8.1
सही परीक्षण
प्रति प्रयास पास दर 52.4% 71.4%
अस्थिर टेस्ट 3 5
कुल रन 63 63
प्रति परिणाम लागत 0.333 0.871
कुल लागत $0.034 $0.080
इनपुट कीमत $0.435 / 1M $0.065 / 1M
आउटपुट कीमत $0.870 / 1M $0.260 / 1M
कुल इनपुट टोकन 53,558 38,926
आउटपुट टोकन 11,424 2,088
रीजनिंग टोकन 0 294,598
प्रतिक्रिया समय (औसत) 6.41s 63.29s
प्रतिक्रिया समय (अधिकतम) 30.09s 234.29s
प्रतिक्रिया समय (कुल) 134.66s 1265.85s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#58 DeepSeek V4 Pro

none
अमान्य SVG
लागत
$0.000
समय
300.0s
टोकन
0 tok

#70 Qwen3.5-Flash

medium
लागत
$0.002
समय
25.8s
टोकन
4,294 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 3.2 6.1 16.7% 2 4.02s 540 1,168 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 672 383 32,992
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 5.6 10.0 33.3% 0 13.38s 7,275 5,500 0
Qwen3.5-Flash 3.7 7.2 22.2% 1 58.87s 6,685 302 90,081
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 9.5 10.0 100.0% 0 23.74s 27,529 2,235 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 14,934 483 8,270
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 10.0 10.0 100.0% 0 4.61s 7,568 200 0
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 6,061 235 16,237
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 5.3 10.0 33.3% 0 3.72s 666 24 0
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 581 58 43,615
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 5.0 10.0 0.0% 0 2.05s 471 126 0
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 516 99 38,486
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 6.3 5.8 66.7% 1 4.12s 627 713 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 699 98 14,139
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 10.0 10.0 100.0% 0 3.61s 594 442 0
Qwen3.5-Flash 8.2 7.2 88.9% 1 27.61s 381 89 12,457
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 10.0 10.0 100.0% 0 7.40s 8,105 328 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 8,193 309 1,284
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 3.0 10.0 0.0% 0 5.76s 183 688 0
Qwen3.5-Flash 3.0 10.0 0.0% 0 48.98s 204 32 37,037

त्वरित तुलना

तुलना जोड़ी बदलें