नेविगेशन
AI BENCHY
तुलना करें चार्ट Karyapranali
❤️ Made by XCS
Your ad here

AI BENCHY तुलना

Trinity Large Preview vs MiniMax: MiniMax M2.5

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-06

मेट्रिक Trinity Large Preview none रिलीज़: 2026-01-27 निःशुल्क उपलब्ध MiniMax: MiniMax M2.5 medium रिलीज़: 2026-02-12
रैंक #45 #43
औसत स्कोर 4.2 4.7
संगति 9.6 5.6
प्रति परिणाम लागत 0.000 4.981
कुल लागत $0.000 $0.250
सही परीक्षण
प्रति प्रयास पास दर 33.3% 60.4%
अस्थिर टेस्ट 1 9
कुल रन 48 (16 x 3) 48 (16 x 3)
आउटपुट टोकन 1,837 107,044
रीजनिंग टोकन 0 206,190
प्रतिक्रिया समय (औसत) 3.15s 43.03s
प्रतिक्रिया समय (अधिकतम) 8.91s 237.27s
प्रतिक्रिया समय (कुल) 50.46s 387.25s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 0.0% 0 3.59s 587 0
MiniMax: MiniMax M2.5 9.3 7.9 88.9% 1 32.42s 286 45,112
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 0.0% 0 8.91s 294 0
MiniMax: MiniMax M2.5 10.0 2.1 66.7% 1 60.39s 740 9,713
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 9.9 10.0 100.0% 0 3.26s 186 0
MiniMax: MiniMax M2.5 10.0 1.7 66.7% 2 7.48s 266 3,835
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 4.0 10.0 33.3% 0 877ms 25 0
MiniMax: MiniMax M2.5 10.0 4.4 22.2% 2 237.27s 105,047 133,487
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.0 9.9 0.0% 0 2.86s 124 0
MiniMax: MiniMax M2.5 3.0 2.5 33.3% 1 6.63s 25 1,686
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.5 6.7 16.7% 1 1.09s 63 0
MiniMax: MiniMax M2.5 8.0 6.8 83.3% 1 4.64s 252 1,873
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 4.0 10.0 33.3% 0 3.30s 291 0
MiniMax: MiniMax M2.5 4.0 7.2 44.4% 1 11.54s 159 9,547
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
MiniMax: MiniMax M2.5 10.0 10.0 100.0% 0 15.35s 269 937

त्वरित तुलना

तुलना जोड़ी बदलें