नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

DeepSeek: DeepSeek V3.2 vs Inception: Mercury 2

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक DeepSeek V3.2 DeepSeek V3.2 none रिलीज़: 2025-12-01 Mercury 2 Mercury 2 medium रिलीज़: 2026-02-24
स्कोर 6.1 6.5
रैंक #63 #53
संगति 8.1 8.6
सही परीक्षण
प्रति प्रयास पास दर 50.0% 53.7%
अस्थिर टेस्ट 4 3
कुल रन 54 54
प्रति परिणाम लागत 0.226 0.580
कुल लागत $0.016 $0.047
???? ??? $0.260 / 1M $0.250 / 1M
????? ??? $0.380 / 1M $0.750 / 1M
आउटपुट टोकन 8,384 3,972
रीजनिंग टोकन 0 48,333
प्रतिक्रिया समय (औसत) 12.09s 2.21s
प्रतिक्रिया समय (अधिकतम) 115.89s 14.63s
प्रतिक्रिया समय (कुल) 217.56s 37.51s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 3.2 9.8 0.0% 0 7.63s 1,419 0
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 2.4 1.3 33.3% 1 7.63s 553 0
Mercury 2 10.0 10.0 100.0% 0 1.53s 249 2,213
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 2,887 0
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 1,710 0
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 3.6 7.2 22.2% 1 1.61s 24 0
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 2.86s 67 0
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 66 0
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 8.5 7.5 88.9% 1 7.37s 1,136 0
Mercury 2 3.9 7.5 22.2% 1 934ms 354 2,758
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 522 0
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956

त्वरित तुलना

तुलना जोड़ी बदलें