नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

DeepSeek: DeepSeek V3.2 vs OpenAI: GPT-5.3-Codex

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-15

मेट्रिक DeepSeek V3.2 DeepSeek V3.2 medium रिलीज़: 2025-12-01 GPT-5.3-Codex GPT-5.3-Codex medium रिलीज़: 2026-02-05
रैंक #14 #5
स्कोर 8.1 8.7
संगति 8.5 9.1
प्रति परिणाम लागत 0.225 4.485
कुल लागत $0.025 $0.539
सही परीक्षण
प्रति प्रयास पास दर 79.2% 83.3%
अस्थिर टेस्ट 3 2
कुल रन 48 48
आउटपुट टोकन 7,392 1,764
रीजनिंग टोकन 39,089 33,348
प्रतिक्रिया समय (औसत) 39.48s 16.59s
प्रतिक्रिया समय (अधिकतम) 93.11s 100.93s
प्रतिक्रिया समय (कुल) 631.71s 265.39s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 7.8 9.9 66.7% 0 33.39s 1,171 4,893
GPT-5.3-Codex 10.0 10.0 100.0% 0 4.69s 216 1,421
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 571 6,296
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 207 7,693
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 5.3 7.2 44.4% 1 39.32s 3,081 7,856
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 5.4 2.5 66.7% 1 31.30s 68 2,366
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 1,397 2,845
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 8.2 7.2 88.9% 1 36.87s 390 6,281
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.12s 352 1,644
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 507 859
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492

त्वरित तुलना

तुलना जोड़ी बदलें