नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

MiniMax: MiniMax M2.5 vs OpenAI: gpt-oss-120b

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-22

मेट्रिक MiniMax M2.5 MiniMax M2.5 medium रिलीज़: 2026-02-12 निःशुल्क उपलब्ध gpt-oss-120b gpt-oss-120b none रिलीज़: 2025-08-05 निःशुल्क उपलब्ध
स्कोर 5.4 5.2
रैंक #119 #129
विश्वसनीयता 8.3 10.0
संगति 6.1 8.7
सही परीक्षण
प्रति प्रयास पास दर 50.0% 36.8%
अस्थिर टेस्ट 10 3
कुल रन 60 57
प्रति परिणाम लागत 6.086 0.201
कुल लागत $0.305 $0.011
???? ??? $0.150 / 1M $0.000 / 1M
????? ??? $1.150 / 1M $0.000 / 1M
आउटपुट टोकन 108,678 51,505
रीजनिंग टोकन 251,994 0
प्रतिक्रिया समय (औसत) 50.25s 21.86s
प्रतिक्रिया समय (अधिकतम) 237.27s 113.71s
प्रतिक्रिया समय (कुल) 603.06s 349.78s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 7.9 6.3 83.3% 2 20.82s 286 45,344
gpt-oss-120b 6.5 10.0 50.0% 0 32.84s 8,676 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 3.5 9.8 0.0% 0 125.80s 354 27,037
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 4.5 2.1 66.7% 1 60.39s 740 9,713
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 4.6 1.7 66.7% 2 7.48s 266 3,835
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 2.9 4.4 22.2% 2 237.27s 105,047 133,487
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 3.8 2.5 33.3% 1 6.63s 25 1,686
gpt-oss-120b 4.8 10.0 0.0% 0 10.79s 615 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 7.5 6.7 66.7% 1 4.64s 252 1,873
gpt-oss-120b 9.8 10.0 100.0% 0 5.10s 1,982 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 5.3 7.2 44.4% 1 11.54s 159 9,547
gpt-oss-120b 4.4 4.5 44.5% 2 9.51s 3,781 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 10.0 10.0 100.0% 0 15.35s 269 937
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 3.0 10.0 0.0% 0 80.79s 1,280 18,535
gpt-oss-120b 3.0 10.0 0.0% 0 47.29s 3,138 0

त्वरित तुलना

तुलना जोड़ी बदलें