नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Inception: Mercury 2 vs MiniMax: MiniMax M2.5

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक Mercury 2 Mercury 2 none रिलीज़: 2026-02-24 MiniMax M2.5 MiniMax M2.5 medium रिलीज़: 2026-02-12 निःशुल्क उपलब्ध
स्कोर 4.8 5.7
रैंक #89 #69
संगति 9.0 5.6
सही परीक्षण
प्रति प्रयास पास दर 27.8% 57.4%
अस्थिर टेस्ट 2 10
कुल रन 54 54
प्रति परिणाम लागत 0.165 4.987
कुल लागत $0.007 $0.250
???? ??? $0.250 / 1M $0.118 / 1M
????? ??? $0.750 / 1M $0.991 / 1M
आउटपुट टोकन 1,625 107,044
रीजनिंग टोकन 0 206,422
प्रतिक्रिया समय (औसत) 613ms 39.65s
प्रतिक्रिया समय (अधिकतम) 1.27s 237.27s
प्रतिक्रिया समय (कुल) 11.04s 396.47s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 483ms 286 0
MiniMax M2.5 7.9 6.3 83.3% 2 20.82s 286 45,344
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.6 8.9 0.0% 0 969ms 310 0
MiniMax M2.5 3.0 10.0 0.0% 0 0ms 0 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 606ms 131 0
MiniMax M2.5 4.5 2.1 66.7% 1 60.39s 740 9,713
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 7.3 5.9 83.3% 1 667ms 180 0
MiniMax M2.5 4.6 1.7 66.7% 2 7.48s 266 3,835
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 5.3 7.2 44.4% 1 534ms 46 0
MiniMax M2.5 2.9 4.4 22.2% 2 237.27s 105,047 133,487
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 4.8 10.0 0.0% 0 628ms 159 0
MiniMax M2.5 3.8 2.5 33.3% 1 6.63s 25 1,686
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 6.5 10.0 50.0% 0 551ms 82 0
MiniMax M2.5 8.1 6.8 83.3% 1 4.64s 252 1,873
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.1 10.0 0.0% 0 533ms 234 0
MiniMax M2.5 5.3 7.2 44.4% 1 11.54s 159 9,547
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
MiniMax M2.5 10.0 10.0 100.0% 0 15.35s 269 937

त्वरित तुलना

तुलना जोड़ी बदलें