नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

DeepSeek: DeepSeek V3.2 vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-10

मेट्रिक DeepSeek V3.2 DeepSeek V3.2 medium रिलीज़: 2025-12-01 Grok 4.20 Grok 4.20 medium रिलीज़: 2026-03-31
स्कोर 7.2 6.9
रैंक #61 #68
विश्वसनीयता 10.0 10.0
संगति 7.5 8.3
सही परीक्षण
प्रति प्रयास पास दर 72.8% 63.2%
अस्थिर टेस्ट 6 4
कुल रन 57 57
प्रति परिणाम लागत 0.278 7.559
कुल लागत $0.031 $0.756
???? ??? $0.252 / 1M $1.250 / 1M
????? ??? $0.378 / 1M $2.500 / 1M
आउटपुट टोकन 7,035 1,784
रीजनिंग टोकन 53,765 128,233
प्रतिक्रिया समय (औसत) 46.06s 14.53s
प्रतिक्रिया समय (अधिकतम) 180.92s 63.48s
प्रतिक्रिया समय (कुल) 875.23s 276.06s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 9.2 10.0 100.0% 0 24.23s 3,247 6,953
Grok 4.20 8.2 7.9 83.3% 1 3.95s 287 8,312
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 4.7 1.6 66.7% 1 180.92s 626 6,792
Grok 4.20 4.3 1.1 66.7% 1 24.33s 250 12,804
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 571 6,296
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 207 7,693
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 2.9 4.4 22.2% 2 24.27s 21 6,838
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 3.8 2.5 50.0% 1 58.29s 49 2,189
Grok 4.20 3.9 2.6 33.3% 1 24.48s 65 6,440
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 1,397 2,845
Grok 4.20 7.3 6.0 83.3% 1 4.42s 40 5,474
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 6.7 5.0 66.7% 2 36.87s 390 6,281
Grok 4.20 7.7 10.0 66.7% 0 6.20s 149 7,913
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 507 859
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 3.0 10.0 0.0% 0 83.99s 20 7,019
Grok 4.20 3.0 10.0 0.0% 0 63.48s 9 16,442

त्वरित तुलना

तुलना जोड़ी बदलें