नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

DeepSeek: DeepSeek V4 Pro vs Qwen: Qwen3.6 Flash

सारांश

DeepSeek V4 Pro vs Qwen3.6 Flash benchmark तुलना: Qwen3.6 Flash average score में आगे है: 7.5 vs 7.2. DeepSeek V4 Pro की benchmark लागत कम है: $0.034 vs $0.288. DeepSeek V4 Pro तेज है: 6.41s vs 19.25s, pass rates 52.4% vs 71.4%.

अनुशंसित मॉडल: DeepSeek V4 Pro - Its score stays close to the best score here (7.2 vs 7.5), while costing about 8.6x less than Qwen3.6 Flash.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक DeepSeek V4 Pro DeepSeek V4 Pro none रिलीज़: 2026-04-24 Qwen3.6 Flash Qwen3.6 Flash medium रिलीज़: 2026-04-20
स्कोर 7.2 7.5
रैंक #58 #47
विश्वसनीयता 9.9 10.0
संगति 8.8 8.1
सही परीक्षण
प्रति प्रयास पास दर 52.4% 71.4%
अस्थिर टेस्ट 3 5
कुल रन 63 63
प्रति परिणाम लागत 0.333 3.030
कुल लागत $0.034 $0.288
इनपुट कीमत $0.435 / 1M $0.188 / 1M
आउटपुट कीमत $0.870 / 1M $1.125 / 1M
कुल इनपुट टोकन 53,558 42,362
आउटपुट टोकन 11,424 2,995
रीजनिंग टोकन 0 245,358
प्रतिक्रिया समय (औसत) 6.41s 19.25s
प्रतिक्रिया समय (अधिकतम) 30.09s 122.87s
प्रतिक्रिया समय (कुल) 134.66s 404.20s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#58 DeepSeek V4 Pro

none
अमान्य SVG
लागत
$0.000
समय
300.0s
टोकन
0 tok

#47 Qwen3.6 Flash

medium
अमान्य SVG
लागत
$0.008
समय
29.9s
टोकन
6,784 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 3.2 6.1 16.7% 2 4.02s 540 1,168 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.10s 672 624 14,024
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 5.6 10.0 33.3% 0 13.38s 7,275 5,500 0
Qwen3.6 Flash 5.0 5.1 44.5% 2 42.85s 7,895 495 67,967
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 9.5 10.0 100.0% 0 23.74s 27,529 2,235 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 20.28s 14,934 483 13,839
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 10.0 10.0 100.0% 0 4.61s 7,568 200 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 9.65s 7,782 270 13,155
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 5.3 10.0 33.3% 0 3.72s 666 24 0
Qwen3.6 Flash 3.5 4.4 33.3% 2 14.65s 771 60 24,409
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 5.0 10.0 0.0% 0 2.05s 471 126 0
Qwen3.6 Flash 4.8 9.9 0.0% 0 9.88s 516 140 5,445
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 6.3 5.8 66.7% 1 4.12s 627 713 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.05s 699 102 7,423
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 10.0 10.0 100.0% 0 3.61s 594 442 0
Qwen3.6 Flash 8.2 7.2 88.9% 1 6.29s 696 460 10,860
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 10.0 10.0 100.0% 0 7.40s 8,105 328 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 4.00s 8,193 335 1,188
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 3.0 10.0 0.0% 0 5.76s 183 688 0
Qwen3.6 Flash 3.0 10.0 0.0% 0 122.87s 204 26 87,048

त्वरित तुलना

तुलना जोड़ी बदलें