नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

DeepSeek: DeepSeek V3.2 vs OpenAI: GPT-5.4 Mini

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-17

मेट्रिक DeepSeek V3.2 DeepSeek V3.2 none रिलीज़: 2025-12-01 GPT-5.4 Mini GPT-5.4 Mini medium रिलीज़: 2026-03-17
रैंक #41 #34
स्कोर 6.4 7.1
संगति 8.5 7.2
प्रति परिणाम लागत 0.220 3.610
कुल लागत $0.016 $0.289
सही परीक्षण
प्रति प्रयास पास दर 51.0% 68.6%
अस्थिर टेस्ट 3 6
कुल रन 51 51
आउटपुट टोकन 7,831 1,708
रीजनिंग टोकन 0 58,019
प्रतिक्रिया समय (औसत) 12.35s 15.66s
प्रतिक्रिया समय (अधिकतम) 115.89s 102.91s
प्रतिक्रिया समय (कुल) 209.94s 266.14s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 3.2 9.8 0.0% 0 7.63s 1,419 0
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 296 2,876
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 2,887 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 317 4,317
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 1,710 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 234 650
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 3.6 7.2 22.2% 1 1.61s 24 0
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 60 43,286
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 2.86s 67 0
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 150 510
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 66 0
GPT-5.4 Mini 7.4 6.5 66.7% 1 2.50s 129 1,337
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 8.5 7.5 88.9% 1 7.37s 1,136 0
GPT-5.4 Mini 6.8 7.9 55.6% 1 4.33s 271 2,449
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 522 0
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 251 2,594

त्वरित तुलना

तुलना जोड़ी बदलें