नेविगेशन
AI BENCHY
तुलना करें चार्ट Karyapranali
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Trinity Large Preview vs OpenAI: GPT-5.2

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-06

मेट्रिक Trinity Large Preview none रिलीज़: 2026-01-27 निःशुल्क उपलब्ध OpenAI: GPT-5.2 medium रिलीज़: 2025-12-11
रैंक #45 #27
औसत स्कोर 4.2 6.5
संगति 9.6 7.9
प्रति परिणाम लागत 0.000 3.125
कुल लागत $0.000 $0.313
सही परीक्षण
प्रति प्रयास पास दर 33.3% 75.0%
अस्थिर टेस्ट 1 4
कुल रन 48 48
आउटपुट टोकन 1,837 2,220
रीजनिंग टोकन 0 16,811
प्रतिक्रिया समय (औसत) 3.15s 15.33s
प्रतिक्रिया समय (अधिकतम) 8.91s 77.80s
प्रतिक्रिया समय (कुल) 50.46s 138.01s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 0.0% 0 3.59s 587 0
OpenAI: GPT-5.2 7.0 7.3 77.8% 1 14.34s 549 2,002
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 0.0% 0 8.91s 294 0
OpenAI: GPT-5.2 10.0 10.0 100.0% 0 14.06s 291 1,757
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 9.9 10.0 100.0% 0 3.26s 186 0
OpenAI: GPT-5.2 9.9 10.0 100.0% 0 3.15s 234 420
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 4.0 10.0 33.3% 0 877ms 25 0
OpenAI: GPT-5.2 4.0 7.2 55.6% 1 77.80s 42 10,342
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.0 9.9 0.0% 0 2.86s 124 0
OpenAI: GPT-5.2 10.0 9.7 0.0% 0 4.32s 162 269
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.5 6.7 16.7% 1 1.09s 63 0
OpenAI: GPT-5.2 9.5 10.0 100.0% 0 3.12s 94 614
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 4.0 10.0 33.3% 0 3.30s 291 0
OpenAI: GPT-5.2 7.0 7.3 77.8% 1 5.47s 609 938
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
OpenAI: GPT-5.2 10.0 1.6 66.7% 1 10.30s 239 469

त्वरित तुलना

तुलना जोड़ी बदलें