नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Trinity Large Preview vs Elephant

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-14

मेट्रिक Trinity Large Preview Trinity Large Preview none रिलीज़: 2026-01-27 निःशुल्क उपलब्ध Elephant Elephant none रिलीज़: 2026-04-14
स्कोर 5.3 5.2
रैंक #74 #81
संगति 9.6 9.6
सही परीक्षण
प्रति प्रयास पास दर 29.6% 31.5%
अस्थिर टेस्ट 1 1
कुल रन 52 54
प्रति परिणाम लागत 0.000 0.000
कुल लागत $0.000 $0.000
???? ??? $0.000 / 1M $0.000 / 1M
????? ??? $0.000 / 1M $0.000 / 1M
आउटपुट टोकन 1,985 2,573
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 5.07s 1.23s
प्रतिक्रिया समय (अधिकतम) 39.47s 3.81s
प्रतिक्रिया समय (कुल) 91.23s 22.16s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.0 10.0 0.0% 0 3.02s 593 0
Elephant 6.6 10.0 50.0% 0 963ms 610 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 6.3 10.0 0.0% 0 39.47s 142 0
Elephant 6.4 3.3 66.7% 1 1.39s 375 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.0 10.0 0.0% 0 8.91s 294 0
Elephant 3.0 10.0 0.0% 0 3.81s 731 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 100.0% 0 3.26s 186 0
Elephant 6.5 10.0 50.0% 0 1.04s 246 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 5.3 10.0 33.3% 0 877ms 25 0
Elephant 3.0 10.0 0.0% 0 927ms 24 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 4.4 9.9 0.0% 0 2.86s 124 0
Elephant 4.0 10.0 0.0% 0 854ms 106 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 4.1 6.7 16.7% 1 1.09s 63 0
Elephant 9.8 10.0 100.0% 0 1.03s 81 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 5.4 10.0 33.3% 0 3.30s 291 0
Elephant 3.3 10.0 0.0% 0 849ms 170 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
Elephant 3.0 10.0 0.0% 0 2.79s 230 0

त्वरित तुलना

तुलना जोड़ी बदलें