नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Trinity Large Preview vs DeepSeek: DeepSeek V3.2

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-03

मेट्रिक Trinity Large Preview Trinity Large Preview none रिलीज़: 2026-01-27 DeepSeek V3.2 DeepSeek V3.2 none रिलीज़: 2025-12-01
स्कोर 4.7 5.4
रैंक #148 #130
विश्वसनीयता 10.0 10.0
संगति 9.3 7.5
सही परीक्षण
प्रति प्रयास पास दर 23.3% 41.7%
अस्थिर टेस्ट 2 6
कुल रन 60 60
प्रति परिणाम लागत 0.017 0.296
कुल लागत $0.008 $0.017
इनपुट कीमत $0.243 / 1M $0.229 / 1M
आउटपुट कीमत $0.243 / 1M $0.344 / 1M
कुल इनपुट टोकन 29,828 53,408
आउटपुट टोकन 2,169 11,159
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 2.98s 14.43s
प्रतिक्रिया समय (अधिकतम) 14.34s 115.89s
प्रतिक्रिया समय (कुल) 56.57s 288.55s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.1 10.0 0.0% 0 2.07s 651 550 0
DeepSeek V3.2 3.2 8.0 8.3% 1 9.35s 494 1,073 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 4.0 6.6 16.7% 1 14.34s 738 397 0
DeepSeek V3.2 3.1 5.4 16.7% 1 20.87s 4,690 4,522 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.0 10.0 0.0% 0 8.91s 12,053 294 0
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 29,843 2,887 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 100.0% 0 3.26s 6,900 186 0
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 7,890 1,710 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 5.3 10.0 33.3% 0 877ms 738 25 0
DeepSeek V3.2 2.9 7.2 11.1% 1 4.17s 624 21 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 4.5 10.0 0.0% 0 873ms 498 104 0
DeepSeek V3.2 4.7 1.6 66.7% 1 9.32s 314 43 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.5 10.0 0.0% 0 822ms 678 63 0
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 627 66 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.6 7.7 11.1% 1 1.97s 669 265 0
DeepSeek V3.2 7.6 7.2 77.8% 1 6.91s 424 298 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 6,699 267 0
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 8,319 522 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.0 10.0 0.0% 0 777ms 204 18 0
DeepSeek V3.2 3.0 10.0 0.0% 0 17.23s 183 17 0

त्वरित तुलना

तुलना जोड़ी बदलें