नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Arcee AI: Trinity Large Preview vs OpenAI: GPT-4o-mini

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-30

मेट्रिक Trinity Large Preview Trinity Large Preview none रिलीज़: 2026-01-27 GPT-4o-mini GPT-4o-mini none रिलीज़: 2024-07-18
स्कोर 5.2 5.1
रैंक #110 #119
विश्वसनीयता लागू नहीं लागू नहीं
संगति 9.6 9.9
सही परीक्षण
प्रति प्रयास पास दर 29.6% 27.8%
अस्थिर टेस्ट 1 0
कुल रन 52 54
प्रति परिणाम लागत 0.000 0.098
कुल लागत $0.000 $0.005
???? ??? $0.150 / 1M $0.150 / 1M
????? ??? $0.450 / 1M $0.600 / 1M
आउटपुट टोकन 1,985 1,947
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 5.07s 2.00s
प्रतिक्रिया समय (अधिकतम) 39.47s 7.58s
प्रतिक्रिया समय (कुल) 91.23s 21.99s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.0 10.0 0.0% 0 3.02s 593 0
GPT-4o-mini 4.8 10.0 25.0% 0 1.34s 186 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 6.3 10.0 0.0% 0 39.47s 142 0
GPT-4o-mini 3.0 8.7 0.0% 0 2.55s 347 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.0 10.0 0.0% 0 8.91s 294 0
GPT-4o-mini 3.0 10.0 0.0% 0 7.58s 568 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 100.0% 0 3.26s 186 0
GPT-4o-mini 10.0 10.0 100.0% 0 1.27s 183 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 5.3 10.0 33.3% 0 877ms 25 0
GPT-4o-mini 3.0 10.0 0.0% 0 637ms 15 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 4.4 9.9 0.0% 0 2.86s 124 0
GPT-4o-mini 4.0 10.0 0.0% 0 909ms 66 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.4 6.2 16.7% 1 1.09s 63 0
GPT-4o-mini 6.3 10.0 50.0% 0 1.27s 69 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 5.4 10.0 33.3% 0 3.30s 291 0
GPT-4o-mini 3.7 10.0 0.0% 0 1.30s 308 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
GPT-4o-mini 10.0 10.0 100.0% 0 2.51s 205 0

त्वरित तुलना

तुलना जोड़ी बदलें