नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

DeepSeek: DeepSeek V3.2 vs OpenAI: GPT-5.4

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक DeepSeek V3.2 DeepSeek V3.2 none रिलीज़: 2025-12-01 GPT-5.4 GPT-5.4 none रिलीज़: 2026-03-05
स्कोर 6.1 5.9
रैंक #63 #65
संगति 8.1 9.1
सही परीक्षण
प्रति प्रयास पास दर 50.0% 42.6%
अस्थिर टेस्ट 4 2
कुल रन 54 54
प्रति परिणाम लागत 0.226 1.477
कुल लागत $0.016 $0.104
???? ??? $0.260 / 1M $2.500 / 1M
????? ??? $0.380 / 1M $15.000 / 1M
आउटपुट टोकन 8,384 2,317
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 12.09s 1.51s
प्रतिक्रिया समय (अधिकतम) 115.89s 2.95s
प्रतिक्रिया समय (कुल) 217.56s 27.21s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 3.2 9.8 0.0% 0 7.63s 1,419 0
GPT-5.4 3.2 8.0 8.3% 1 1.21s 406 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 2.4 1.3 33.3% 1 7.63s 553 0
GPT-5.4 10.0 10.0 100.0% 0 2.95s 480 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 2,887 0
GPT-5.4 3.0 10.0 0.0% 0 2.89s 291 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 1,710 0
GPT-5.4 10.0 10.0 100.0% 0 1.04s 222 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 3.6 7.2 22.2% 1 1.61s 24 0
GPT-5.4 5.3 7.2 44.4% 1 1.07s 50 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 2.86s 67 0
GPT-5.4 4.4 9.9 0.0% 0 1.78s 184 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 66 0
GPT-5.4 6.5 10.0 50.0% 0 1.07s 81 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 8.5 7.5 88.9% 1 7.37s 1,136 0
GPT-5.4 5.6 9.8 33.3% 0 1.52s 357 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 522 0
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0

त्वरित तुलना

तुलना जोड़ी बदलें